影像辨識是模擬人的思考邏輯，我是這樣想，但別人未必！ - 鄉下老師

字體：小中大

影像辨識是模擬人的思考邏輯，我是這樣想，但別人未必！

2019/08/17 03:52:41瀏覽2429｜回應0｜推薦6

昨天與一位客戶線上交談，他有一個略微複雜的辨識需求，我們初步評估可以做到，正在精確評估報價中。雖然影像辨識不是他的專業，但是他興趣極高，很客氣地問東問西，一副好奇寶寶的模樣。我也樂得打開話匣子，毫不藏私的解釋我們會如何進行的步驟，我覺得客戶越知道我們的專業其實更好溝通，也更能建立長期合作的關係。談多了，甚至評論到一些我做影像辨識的哲學概念。

影像辨識就是設法以辨識軟體替代人的視覺判斷，辨識軟體的具體內容就是以一些演算法建構的程式。如果你真的是以「模仿」人的思考模式，也就是傳統已知的明確科學知識，建立出合乎「人的想法」的演算法去達成任務，那才是真正的「人工智慧」，也就是大家所期待的AI研究。不是嗎？

我確實是這麼想，也這麼實踐這個概念，花了五六年逐步建構出目前這套影像辨識的技術，目前是本公司最重要的無形資產！我們已經有信心以此概念去研發出任何目的的影像辨識軟體，但因為每個影像辨識的目的與特性都不同，為了有效達到目標領域的辨識需求，每一個不同的需求都需要時間去學習與整合該領域的知識，所以我們絕對不會聲稱我們擁有「通用」的影像辨識技術。

但是目前我們所知道的主流派影像辨識思維與做法，是與此概念非常不同的！所謂的機器學習或深度學習，就是想跳過物理與各領域本身的專業知識，直接使用數學或統計，就是俗稱的「大數據資料分析」，建構出可以正確判斷出標準答案的應用軟體！就是想作到完全不必懂經濟學根據數據就可以預測出所有股票漲跌的境界！多美好的願景啊？以後都不必讀書了！

即使號稱「模仿人類思考方式」的類神經網路技術，其實也只是抽離出人們想問題時的通用邏輯過程，但是卻將我們思考不同問題時一定會個別引用的環境知識，與特殊邏輯都晾在一邊，不予理會！他們努力在找通用的解法，而非一一解決特定問題。這有點像我們希望教會一個孩子足夠的數學知識之後，他就可以直接看懂與答對英數理化等各科考試的答案！這當然是不可能的！

所以他們的下一步想法就是「訓練」！也就是機器學習或深度學習，用同領域同議題的大量資料，先以人類已知的標準答案做好註記，等於是一個有答案的題庫，接下來不是由人去一一建構如何解題的過程邏輯，而是讓電腦使用已知的演算法，去自行嘗試錯誤排列組合出可以「答對最多題」的演算法！

但是這種「訓練學習」出來的軟體，答對題目的過程可能與我們人的想法完全不同！歪打也可能正著啊！在我的角度看，這就已經悖離了人工智慧的核心精神，但是他們好像覺得沒關係？只要答案是對的就好！而且很自豪，因為他們不需要像傳統科學家一樣，很辛苦一步一腳印地做個案分析，就能直接「猜對」更多的答案？

表面上看起來是連思考研究的工作都由電腦取代了，非常省時省力，但是實際上並非如此。譬如我現在承接特殊辨識目的的案子，我只需要數十張，頂多一百多張涵蓋所需辨識狀況的影像就可以開工，十天半個月內可以建立出辨識主程序，再花一個月用更多的資料作測試，並針對辨識錯誤原因分析，做出對應的程式邏輯調整，順利的話一兩個月就可以結案交貨！

但是機器學習的模式要開工，需要的資料數量絕對不是幾十幾百張影像，而是數千、數萬、甚至數十萬張！統計資料不足就很難「訓練」出辨識能力夠好夠周延的軟體。而且那些大量資料不是蒐集到手就可以用了！還必須使用大量人力去人眼辨識一一製作標準答，沒有答案的話，機器如何知道自己「猜對」了呢？

所以我們這種小公司根本沒有錢這樣辦事！這樣大家就知道為何號稱做AI的公司會需要大筆資金挹注了吧？我的做法就不必靠人投資，用自己的腦袋加上普通的電腦就可以開工了！他們做一樣的軟體成本絕對會高過我的作法好幾倍，針對特定的辨識目的，他們的軟體辨識率也一定不會比我的好。

如果你敢賣這種軟體，噩夢其實才剛剛開始！因為影像辨識與環境關係很大，變數很多，不可能有跟人腦一樣聰明通用的軟體，每個客戶都一定會碰到辨識錯誤甚至無法辨識的狀況，他們花了大錢買軟體，當然有權責問廠商為何如此？此時如果廠商可以修改程式改版更新直接解決問題最好，即使不行，也應該跟客戶詳細解釋無法辨識的原因。

這些售後服務或稱客訴處理就是我日常上班的主要工作之一，雖然有壓力，但是我都能處理，有辨識錯就拿回個案作分析，很快就會知道原因，能處理的狀況就改程式，做不到就解釋原因，讓客戶覺得受到尊重，也知道以後使用本軟體時該如何因應，才能避免那些錯誤。

但是使用機器學習製作的軟體是完全無法這樣回應客戶，做好售後服務或客製化調整的！所以即使我有錢可以玩機器學習，我也不敢出售這種軟體的！一定會被罵得買頭包，還毫無作為改進的空間！所以不要太迷信那些太依賴機器學習的AI產品與公司了！你可能會完全得不到售後服務的！賣你軟體的人，自己都不知道軟體是怎麼運作的？壞了也沒得修？這還不夠可怕嗎？

我當然不會完全否定類神經網路與機器學習這些技術的價值，但是我認為未來影像辨識發展的合理方向，一定是由真正的影像辨識科學家領軍，建立好各種辨識目的的主要流程，再由機器學習接手做好細節參數的調整與最佳化。如果像現在這樣，過度推崇機器學習等技術，等於由盲人騎瞎馬領軍前導，一定會造成資源浪費研發受阻的大災難。

( 心情隨筆｜工作職場 )