他們都是8！但是你用再「深度」的「學習」都學不會的！ - 鄉下老師

字體：小中大

他們都是8！但是你用再「深度」的「學習」都學不會的！

2024/04/05 05:15:30瀏覽990｜回應0｜推薦9

上面是我隨意從我可以辨識成功的車牌影像中擷取出來的8字目標，有點像手寫辨識的概念，機器學習或深度學習都會含糊其辭，有意無意的誤導大眾，以為只要這種變形資料的量夠多，他們就可以「訓練」他們的模型「學習」辨識這些字？最終可以學會辨識所有車牌影像中可能出現的任何一個8字？

這是神話，也是鬼話！當然是科學上不可能辦到的事情！那他們怎麼說手寫辨識「好像」可以？其實也是不行的！稍微寫字習慣超出常見型態的人寫的字就會錯誤百出，如果真的硬是用巨量資料統計學會所有可能的辨識特徵，還不會誤認其他目標為8字，那麼那個模型就會複雜龐大到必須用超級電腦才能完成訓練，並以合理的反應時間運作實際辨識了！想用到他們的成果嗎？你終究必須分擔超級電腦的成本與高額耗電費用的！

各位以為現在流行的生成式AI可以獨立在你的手機或個人電腦中運作嗎？各位以為輝達熱賣的晶片是賣給未來的個人電腦用的嗎？錯得離譜了！其實都是賣給龐大的伺服器電腦用的！因為這種AI需要的資訊量與運算量都遠遠超過個人電腦能負荷的程度，所以想賺錢的廠商就拼命投資建置更多超級電腦，讓一般人上網找超級電腦來完成(他們說的那種)AI工作。

情況一如現在的搜尋引擎，他們說的AI也不是在你的電腦上運作的！現在上網Google不用錢，是因為廠商插播廣告就賺到夠多錢了！但以後上網使用運算量更大很多的AI呢？當然就一定要付錢了！不然你以為那些花大錢買輝達晶片的廠商在嗨甚麼？是看到太多迷信AI無所不能的肥羊已經在排隊待宰了嘛！不跟使用者收錢他們買輝達晶片的錢跟誰要？

很微妙的是：影像辨識其實就是擊中了這種AI模式應用的要害！即使是標準規格的車牌，在真實世界中因為拍攝角度與不同的汙損失焦模糊程度，就是會有如上幾乎是無限種可能的8(與所有字)的不同形狀！想用大量資料「學習」嗎？光是買資料與標記資料的工錢就可以讓影像辨識公司破產了！AI的宣傳已經讓多數人誤以為做影像辨識就必須用他們的那套技術？事實卻是相反的！

真的完全不能用機器學習做影像辨識嗎？其實也不是！只是辨識率絕對不會好到讓顧客滿意而已！譬如八成的車牌辨識率，在馬路上亂槍打鳥收集車牌的軟體還勉強堪用，但是在需要一對一辨識率98%以上的多數應用場域，如停車場或近距離的手拍辨識，即使你散盡家財也無法用機器學習做出商業級辨識軟體的！用統計學做的軟體如同算命，用的資料再多都達不到98%的！

即使較簡單的領域如AOI，就是辨識固定環境下的產品瑕疵之類的應用，用機器學習的成本效益也太差了！有太多傳統影像辨識的技術就可以便宜做到高辨識準確率，堅持用機器學習開發影像辨識產品是脫了褲子放屁多此一舉，鐵定是會賠錢的！所以真的別傻了，此路完全不通的！「學」海無涯，回頭是岸啊！

面對無限可能的歪斜模糊車牌字元影像，我是怎麼不用機器學習，不花大錢就做得很好呢？其實就是堅持傳統科學，充分使用各種已知的物理現象與條件解題！先找到車牌，再經過幾何校正得到合理的車牌正面影像，再一一辨識已經變端正的字元影像的！我未必已經做得很完美，但辨識率已經遠勝機器學習深度學習了！我已經證實此路不但行得通還很省錢！所以我的公司還沒破產倒閉就是明證！

( 心情隨筆｜工作職場 )