逐步聚焦處理，人不是都會這麼做嗎？這才叫人工智慧啊！ - 鄉下老師

字體：小中大

逐步聚焦處理，人不是都會這麼做嗎？這才叫人工智慧啊！

2020/07/09 09:28:30瀏覽831｜回應0｜推薦6

面對下圖這樣車牌模糊的照片，要正確辨識難度很高！即使我有非常聰明的演算法，可以地毯式的搜尋檢視全圖的每一個可能目標，「很有耐心」的找到車牌，但實務上我不能這麼作的！因為辨識時間會拉得很長，如果因為目標模糊我就要辨識好幾秒鐘，那我也別想在市場上混了！

我的車牌辨識除了辨識能力強之外，辨識速度也是非常快的！否則怎麼能在需要高速的動態辨識產品上幾乎制霸全台？上面這張圖我的辨識時間就只需要0.1秒！跟清晰的照片幾乎完全一樣！我是怎麼作到的？沒有甚麼神奇的外星科技，還是從模仿人的思考方式切入做出來的！

重點在於我們人的眼睛看東西時也會先設定大概的目標，粗篩掃描鎖定可能的車牌區塊之後再仔細看！不會呆呆地用最大的注意力盯著圖片逐點找東西的！我會先設定要找全圖最明顯的幾十個目標，大概結果會是這樣：

雖然車牌對比度不佳，連柏油路的礫石反光都比字元亮，但是粗篩出這些目標後，即使車牌字元並不齊全，也足夠看出車牌在哪裡了！接下來呢？我就不必繼續在全圖這麼大的範圍作辨識了！集中火力辨識車牌附近的小區域吧！

這第二個階段處理的圖形很小，當然不必花太多時間，還比全圖處理時更加精緻精準！所以才能大約0.1秒就收工！在我最新的i9電腦上做是80多毫秒！一般i7電腦大概就是0.1幾秒了！整體概念就是這樣的，當然實作所有過程需要處理的細節很多，所以研發時間不會是幾天，而是幾年！

我們常說人的智慧很神奇，像這種模糊判斷的能力，就是比傳統硬梆梆的數學公式聰明很多！當電腦程式變得有點聰明時，我們就會說它是「人工智慧」！幾年前我就認定影像辨識就是將人看東西的哲學寫成程式，以前的人在這方面的努力很少，所以我也不必去讀很多書，以自己的視覺思維為師即可，就這樣一路走到現在，也證實了我的想法沒錯，而且真的可以做到！

這就是我影像辨識事業發展的主軸方向了！但是同樣的這段時間，世界上其他地方說的影像辨識已經跟我的想法作法大不相同了！表面上說「類神經網路」好像是師法人的思考方式，但是他們只停留在最低階的反射動作層次，用那個層次產生數學，然後就變成不再思考實際現象成因與資料的關係，只想用統計學的對答案方式湊出可行的辨識流程！泛稱為機器學習或深度學習！

但是真正學習的主體已經不是人類自己，而是自我發展的程式本身！如果這麼作真能解決問題，讓機器變成比人聰明的實體，也算是一種成績！可惜事實上除了邏輯規則非常明確的下棋之類的「工作」之外，這種機器學習的真實成績實在慘不忍睹！他們至今都還不是實用產品開發可以依賴的有效技術。

大家可以認真審視目前各個領域真正有效的人工智慧產品研發，其實做法都跟我差不多！努力釐清人的智慧邏輯與程序，將他們數位化程式化而已！跟孔子說的「述而不作」很類似！如果我們一般人程度的智慧都還不能變成人工智慧的產品，談甚麼發明創新呢？

我們真正需要認真深入研究的東西，根本不是甚麼神奇的新數學方法！而是我們自己的想法啊！想研究人工智慧的年輕後進們，快點覺醒吧！別再浪費時間去玩甚麼機器學習深度學習了！他們只會讓你浪費時間原地踏步的！以自己為師，甚至以小朋友為師，搞清楚人面對問題的詳細思考過程，然後學會用程式寫出來，你就可以變成專家達人了！我的事業就是這樣來的！

( 心情隨筆｜工作職場 )