網路城邦
上一篇 回創作列表 下一篇  字體:
任何小聰明都是研發AI的利器,善用字距也可以猜對答案!
2024/01/24 09:57:22瀏覽440|回應0|推薦8

現在大眾認知的AI都被誤導到一定是與機器學習的概念技術有關,影像辨識好像就是使用MLDLCNN的科技?其實是錯得離譜了!以結果論,會被視為「AI」的商業產品就是可以做出近似,甚至超越人類認知判斷能力的軟體或硬體機器。

但事實上這些產品中九成以上都與機器學習無關,大部分可以自動做出判斷或反應的軟硬體,都只是根據環境偵測的簡單物理測量數據,再按照合理的科學原理或人類經驗模式,經過準確的演算法達成AI反應的!譬如冷氣機測到溫度夠低了就會降低壓縮機的轉速,汽車導航的建議也不是靠機器學習摸索出來的,而是根據地理資訊與限制條件最佳化計算出來的!

機器學習的相關技術並不是可以讓AI產品比這些傳統技術更聰明或更準確!而是在我們對於某些模糊事件的機制毫無概念可以依循時,用資料統計的方式可以得到「差不多」可以接受的結果而已!如果我們可以用已知的科學、經驗或常識量化自動決策的事情,是絕對不應該採用機器學習去做的!機器學習其實是比較不準確也不可靠的解決方案!

所以我認為真正廣用的AI概念與技術其實是我們的知識、常識甚至直覺!也就是任何我們知道的,所有有利於解決問題的小聰明,都可以是比機器學習更有效的AI設計資源!上圖車牌辨識就是一個很好的例子!

因為車牌基座凹陷造成的陰影會讓「T」字的上面橫線看不清楚,基本辨識結果只看到一直線,就會誤認為一個「I」或數字1。這件事讓我困擾了好久,想學習一般人的視力做更抽象更多亮度層次的綜合辨識?這個程式邏輯實在太難寫了!有沒有更簡單的邏輯可以準確推斷這是一個T而不是I字呢?

有的!至少在印尼車牌中,字元之間不會保持字距(字元中心點之間的距離)等寬的,比較窄的I字與相鄰字元的間距就會比正常寬度的T字小,所以即使我看不到T字的頭部,從那根直線與相鄰字元之間的距離就可以判斷是不是T了!如果辨識出來的「I」與隔壁的字距寬度與兩個正常寬度的字差不多,那就可以將辨識結果直接改成T了!這是就是最正確的AI判斷,不會錯的!

同理,數字17也會有類似的問題,也可以用類似的邏輯判斷看不到頭部的7是不是真的是個7了!我的影像辨識準確率很高就是靠著這些一定不會錯的小聰明堆砌出來的!我是絕對不會妄想機器學習可以幫我把這類問題做得更好的!就像算命吧?那是真的非常無助迷惑不知如何是好時才會去做的傻事!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180290724