網路城邦
上一篇 回創作列表 下一篇  字體:
確定的資訊可以否決不確定的資訊,機器學習知道嗎?
2024/05/11 09:21:31瀏覽576|回應0|推薦6

台灣車牌有六碼舊車牌與七碼新車牌的兩種字型,大部分的英數字在兩種字型中其實都很像,只有369三個數字幾乎是截然不同!也就是如果你在可能是車牌的影像中發現了這三個數字,拿兩種字型的標準字模一比對,就可以立即斷定你找到的是六碼或七碼的車牌了!

因為目前使用中的車牌兩種都很多,在一般街景影像中,車牌較不清楚,可能會缺漏字時,這個資訊就像警察辦案時在現場發現的指紋或DNA一樣,你未必在每個犯罪現場都可以找到,正如不是每張車牌都一定會包含369三個數字一樣,但如果發現了!這種證據的可靠度是遠高於其他如目擊者證詞之類的證據的!所以警察一發現這種證據所有對於案情的推理就必須重新整理了!即使有八個證據指向嫌犯A,只要DNA是指向另一人,就不能輕易結案說是A幹的!

所謂的機器學習(ML)就是盡量蒐集所有可以幫助辨識目標的特徵線索,然後建立一套盡可能合理的數學模式,投入大量資料替每種特徵或證據建立相對的權重,調整出最佳化的參數組合。當然要建立盡量對的模式非常困難,不只是量化哪一種特徵比較重要而已,某些特徵證據是互斥的!可以互相否定的,如果模式不夠合理,當然「訓練」結果也不會好的!

一心想讓電腦自行產生智慧,不必讓研發人員傷腦筋的AI專家是沒耐心好好研究事實與傳統科學的,所以ML表現欠佳時,就出現了更複雜的,可以自行產生很多模式的深度學習(DL)等技術,但天下沒有白吃的午餐,這樣產生的AI成本更高!以影像辨識來說結局更慘!即使投入無限資本,辨識率成效還是不如專家們用科學原理推導的演算法為基礎的AI!目前市場的實況就是如此!

在我的感覺是:這些堅信閉著眼睛不看事實,不思考科學原理,只靠資料統計與嘗試錯誤就可以得到高度智慧的AI專家實在非常奇怪?他們得到的挫敗其實遠多於成功經驗,至少在需要高正確率的影像辨識實務應用市場上,他們幾乎一事無成!卻依舊得意揚揚耀武揚威!就像詐騙集團的投資群組,其實從未真的獲利,還是能說得讓一大堆人深信不疑?太厲害了!

如我之前一再闡述的理念,我絕對不反對AI的發展,但是身為影像辨識產業中已有一席之地的成功廠商,我必須說MLDLCNN等狹義的AI技術,絕對不能作為AI影像辨識研發的主體與主導,而是應該做為資料不足或理論缺乏時的探索輔助手段!他們不夠格作為主角,但極適合擔任有利的配角!

如果堅持目前以MLDLCNN為主體的AI研發操作方式,無形的代價就是高到不合理的運算量繼續氾濫,更多的軟硬體與電力資源的浪費,以及一個其實可以避免的,更發燒更熾熱的地球!我為此憂心不已!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180599366