這麼模糊的AI影像辨識也不必用機器學習的！ - 鄉下老師

字體：小中大

這麼模糊的AI影像辨識也不必用機器學習的！

2024/01/17 09:35:23瀏覽458｜回應0｜推薦5

從一開始作影像辨識時，我就意識到人的視覺辨識能力實在太神奇了！像這麼模糊的字元，大部分的人也都會有一致的共識，最末兩字應該就是B與K！但是拉近放大看時，反而就不太確定是K或X了？傳統影像辨識科學的態度就是逐步做各種影像處理，用各種尺度分析、組合與理解資料，找出最正確，通常也就是一般人會認定的答案！

當我好不容易讀完也學會所有書上說過的影像處理方法與辨識理論之後，老實說，我還是覺得距離一般人的視覺智慧非常遙遠！所以我才會常常感慨說：「影像辨識的科學還在非常原始的階段！」或許正因為這些神奇的視覺智慧邏輯實在太微妙複雜，心急的人就不想慢慢研究了！那就用大量資料與暴力運算讓機器去學習(統計)那些深不可測的智慧吧！

這樣蠻幹即使多半不會成功，但至少會有進展了！而且不必太傷腦筋，不必是IQ180的普通人也可以操作那些數學模式得到「大概」對的答案！這就是現在大家認為的「AI」主流思維了！如果選擇的數學模式足夠涵蓋所有變因，資料量也足以涵蓋所有的現象，確實可以得到相當的成果。譬如語音資料的理解就做得很好了！

但是影像的複雜度，與辨識需要的準確度是遠遠超過語音的！說是平方倍的複雜度都太低估了！所以機器學習技術在影像辨識上的進展是極其緩慢的！我對影像辨識研究的態度選擇比較像愚公移山，或想將鐵杵磨成繡花針的老婆婆！路比較長不表示就不可能走到目標！山畢竟還是土石做的而已，一點一點挖遲早還是可以挖開的！

有趣的是：這條漫漫長路多年走下來，我的進展甚至比主流派的機器學習還走得更遠！如上圖那麼模糊的辨識過程，還是一板一眼用明確的演算法如傳統的專家系統二元樹的架構逐步分析判斷出來的！所以任何辨識錯誤我都可以充分理解與掌握過程加以優化修改，我的金字塔是絕對明確、緊密與穩固在增高的！因為是明確設計的演算法，所以沒有統計猜測的評估過程，辨識速度也是遠勝機器學習產品的！

在我來說，「知其然也知其所以然」才是真正的科學成果！總是可以「猜對」答案不會讓我滿意的！所以我始終無法像目前多數的「AI」研究者一樣，整天操作自己也不知道詳細邏輯的機器學習工具就覺得很滿足？想到那種狀態我就會覺得很恐怖！很像天天在算命、找明牌與等待奇蹟，永遠不能確定自己在幹甚麼的感覺？

我不是不願意透露我是怎麼作的，但是細節說多了大家也懶得看的！或許等我的技術更成熟與系統化之後，如果我的產品也真的好過機器學習的AI產品時，我會願意把影像辨識的教學也當我的事業來做的！現階段呢？我就繼續用我的方式做更多好產品來賣才是正事！該繼續上班了！

( 心情隨筆｜工作職場 )