確定的資訊可以否決不確定的資訊，機器學習知道嗎？ - 鄉下老師

字體：小中大

確定的資訊可以否決不確定的資訊，機器學習知道嗎？

2024/05/11 09:21:31瀏覽628｜回應0｜推薦6

台灣車牌有六碼舊車牌與七碼新車牌的兩種字型，大部分的英數字在兩種字型中其實都很像，只有369三個數字幾乎是截然不同！也就是如果你在可能是車牌的影像中發現了這三個數字，拿兩種字型的標準字模一比對，就可以立即斷定你找到的是六碼或七碼的車牌了！

因為目前使用中的車牌兩種都很多，在一般街景影像中，車牌較不清楚，可能會缺漏字時，這個資訊就像警察辦案時在現場發現的指紋或DNA一樣，你未必在每個犯罪現場都可以找到，正如不是每張車牌都一定會包含369三個數字一樣，但如果發現了！這種證據的可靠度是遠高於其他如目擊者證詞之類的證據的！所以警察一發現這種證據所有對於案情的推理就必須重新整理了！即使有八個證據指向嫌犯A，只要DNA是指向另一人，就不能輕易結案說是A幹的！

所謂的機器學習(ML)就是盡量蒐集所有可以幫助辨識目標的特徵線索，然後建立一套盡可能合理的數學模式，投入大量資料替每種特徵或證據建立相對的權重，調整出最佳化的參數組合。當然要建立盡量對的模式非常困難，不只是量化哪一種特徵比較重要而已，某些特徵證據是互斥的！可以互相否定的，如果模式不夠合理，當然「訓練」結果也不會好的！

一心想讓電腦自行產生智慧，不必讓研發人員傷腦筋的AI專家是沒耐心好好研究事實與傳統科學的，所以ML表現欠佳時，就出現了更複雜的，可以自行產生很多模式的深度學習(DL)等技術，但天下沒有白吃的午餐，這樣產生的AI成本更高！以影像辨識來說結局更慘！即使投入無限資本，辨識率成效還是不如專家們用科學原理推導的演算法為基礎的AI！目前市場的實況就是如此！

在我的感覺是：這些堅信閉著眼睛不看事實，不思考科學原理，只靠資料統計與嘗試錯誤就可以得到高度智慧的AI專家實在非常奇怪？他們得到的挫敗其實遠多於成功經驗，至少在需要高正確率的影像辨識實務應用市場上，他們幾乎一事無成！卻依舊得意揚揚耀武揚威！就像詐騙集團的投資群組，其實從未真的獲利，還是能說得讓一大堆人深信不疑？太厲害了！

如我之前一再闡述的理念，我絕對不反對AI的發展，但是身為影像辨識產業中已有一席之地的成功廠商，我必須說ML、DL與CNN等狹義的AI技術，絕對不能作為AI影像辨識研發的主體與主導，而是應該做為資料不足或理論缺乏時的探索輔助手段！他們不夠格作為主角，但極適合擔任有利的配角！

如果堅持目前以ML、DL與CNN為主體的AI研發操作方式，無形的代價就是高到不合理的運算量繼續氾濫，更多的軟硬體與電力資源的浪費，以及一個其實可以避免的，更發燒更熾熱的地球！我為此憂心不已！

( 心情隨筆｜工作職場 )