研究影像辨識真的可以模仿人的認知過程 - 鄉下老師

字體：小中大

研究影像辨識真的可以模仿人的認知過程

2018/12/28 09:43:25瀏覽932｜回應0｜推薦8

Soft Computing Approach to Pattern Classification and Object Recognition

剛開始看到這本書名開頭的Soft以為是與影像辨識的軟體製作有關的書，真的買來一看更為驚艷！原來這位印度學者2012年就提出了影像辨識可以模仿人類認知過程的概念，全書我才剛開始看，但是顯然他是理論與實務兼具的專家，不像我是對於影像辨識的方法論還腦袋空空就闖入這個領域的人！但是他並沒有因為很深的方法論訓練就以數學邏輯為研究思考的軸心！還是強調他的影像辨識理論基本上是模仿人類認知的過程！

上面是他寫的本書摘要，反白標記的一句中文根據Google翻譯是這樣的：

本專書基本上模仿了人類決策的認知過程，並在表徵多樣性中傳遞了感性完整性的信息。

真的好感動！原來吾道不孤，真的有「先聖先賢」有過跟我一樣的想法，影像辨識真的可以用模仿人類認知的理念繼續挺進！看他都寫不少書了，我想他對於影像辨識的實務經驗或理論深度都是我的老前輩，這更增加了我堅持理念繼續挺進的信心。

我之前有位畢業於台大光電所專攻影像辨識的碩士員工，跟我做了一年，影像辨識相關學歷比我還好，我當然會寄予厚望！覺得我的武功必然可以由他發揚光大，公司的影像辨識事業也一定可以越做越大！但是結果卻令人失望，他真的知道非常多影像辨識的方法論，肯定是很認真讀書也讀了很多論文的好學生。

但是我帶著他參與了很多影像辨識的研發議題，辨識目標與環境狀況他都聽得懂，卻永遠沒有真正找出解決方案的能力！他會跟我說很多方法可以「試試」，也真的會寫程式去實驗，但是很快就會走到死巷，然後只能去試試看「另一個方法」！如果我忍住不去介入他的「研究」他就可以這樣做到天長地久！即使我刻意給他較為單純的研究議題，他也從來沒真的完成過任何一個專案！

在我的觀點，他的研究選擇都有點奇怪，因為我總覺得有更直接的方法！譬如用遮罩運算他就一定要用二維矩陣，我會想如果只需要左右方向變異的資訊，我不能只用一維的短陣列嗎？我也努力教他我思考的方式，就是模仿人的認知過程，先問我們看到這種影像，想辨識特定目標時會怎麼想？會需要甚麼資訊？先確定自己的想法目標後再去找數學方法，幾乎無往不利！

結果很搞笑，我那一年其實主要都是向他授課，希望他能聽懂就好，其他員工是根本不碰影像辨識工作的！但是我想反正要講課嘛！如果其他學生員工不排斥學習的話，也叫過來一起加減聽吧？卻這樣意外地教出了一個「火工頭陀」！就是現在我最得力的RD！一位從來沒接觸過影像辨識，只有大學學歷的女生。

我不知道這是人的個性使然，還是這位台大高材生的腦袋裡已經有太多僵化的知識窒礙，反正一年下來我終於放棄了對他的期待，臨走之前他說了一段讓我哭笑不得的結語：「老師！我這一年最大的收穫是知道了原來我們可以用常識與直覺來作影像辨識！」所以他是知道我的哲學與企圖心的，但就是無法學會像我這樣思考問題。

碩士走了之後，一直在旁邊偷聽的火工頭陀，變成我唯一剩下沒被資遣的工程師，我問她想不想接手作影像辨識？她說很想，就怕自己不夠力？我說試了才知道，我原本也是外行。結果她很快就可以模仿我的思考方式，半年後就可以獨力完成很多辨識議題，現在真的變成我研發工作的分身了！公司除了車牌辨識之外的影像辨識專案都是她在做的！

本書作者說的「Soft」我現在知道，就是必須順應人的認知過程與方式對於複雜僵硬的既有演算法做出調整！就是所謂的「盡信書不如無書」！任何方法的起源也只是應運解決某種問題狀況而生，不是上帝給的十戒！作者的概念就是依據人的認知過程彈性調整方法論的實際使用方式，其實也是我目前研發影像辨識產品的理念。

( 心情隨筆｜工作職場 )