網路城邦
上一篇 回創作列表 下一篇   字體:
他們都是8!但是你用再「深度」的「學習」都學不會的!
2024/04/05 05:15:30瀏覽884|回應0|推薦9

上面是我隨意從我可以辨識成功的車牌影像中擷取出來的8字目標,有點像手寫辨識的概念,機器學習或深度學習都會含糊其辭,有意無意的誤導大眾,以為只要這種變形資料的量夠多,他們就可以「訓練」他們的模型「學習」辨識這些字?最終可以學會辨識所有車牌影像中可能出現的任何一個8字?

這是神話,也是鬼話!當然是科學上不可能辦到的事情!那他們怎麼說手寫辨識「好像」可以?其實也是不行的!稍微寫字習慣超出常見型態的人寫的字就會錯誤百出,如果真的硬是用巨量資料統計學會所有可能的辨識特徵,還不會誤認其他目標為8字,那麼那個模型就會複雜龐大到必須用超級電腦才能完成訓練,並以合理的反應時間運作實際辨識了!想用到他們的成果嗎?你終究必須分擔超級電腦的成本與高額耗電費用的!

各位以為現在流行的生成式AI可以獨立在你的手機或個人電腦中運作嗎?各位以為輝達熱賣的晶片是賣給未來的個人電腦用的嗎?錯得離譜了!其實都是賣給龐大的伺服器電腦用的!因為這種AI需要的資訊量與運算量都遠遠超過個人電腦能負荷的程度,所以想賺錢的廠商就拼命投資建置更多超級電腦,讓一般人上網找超級電腦來完成(他們說的那種)AI工作。

情況一如現在的搜尋引擎,他們說的AI也不是在你的電腦上運作的!現在上網Google不用錢,是因為廠商插播廣告就賺到夠多錢了!但以後上網使用運算量更大很多的AI呢?當然就一定要付錢了!不然你以為那些花大錢買輝達晶片的廠商在嗨甚麼?是看到太多迷信AI無所不能的肥羊已經在排隊待宰了嘛!不跟使用者收錢他們買輝達晶片的錢跟誰要?

很微妙的是:影像辨識其實就是擊中了這種AI模式應用的要害!即使是標準規格的車牌,在真實世界中因為拍攝角度與不同的汙損失焦模糊程度,就是會有如上幾乎是無限種可能的8(與所有字)的不同形狀!想用大量資料「學習」嗎?光是買資料與標記資料的工錢就可以讓影像辨識公司破產了!AI的宣傳已經讓多數人誤以為做影像辨識就必須用他們的那套技術?事實卻是相反的!

真的完全不能用機器學習做影像辨識嗎?其實也不是!只是辨識率絕對不會好到讓顧客滿意而已!譬如八成的車牌辨識率,在馬路上亂槍打鳥收集車牌的軟體還勉強堪用,但是在需要一對一辨識率98%以上的多數應用場域,如停車場或近距離的手拍辨識,即使你散盡家財也無法用機器學習做出商業級辨識軟體的!用統計學做的軟體如同算命,用的資料再多都達不到98%的!

即使較簡單的領域如AOI,就是辨識固定環境下的產品瑕疵之類的應用,用機器學習的成本效益也太差了!有太多傳統影像辨識的技術就可以便宜做到高辨識準確率,堅持用機器學習開發影像辨識產品是脫了褲子放屁多此一舉,鐵定是會賠錢的!所以真的別傻了,此路完全不通的!「學」海無涯,回頭是岸啊!

面對無限可能的歪斜模糊車牌字元影像,我是怎麼不用機器學習,不花大錢就做得很好呢?其實就是堅持傳統科學,充分使用各種已知的物理現象與條件解題!先找到車牌,再經過幾何校正得到合理的車牌正面影像,再一一辨識已經變端正的字元影像的!我未必已經做得很完美,但辨識率已經遠勝機器學習深度學習了!我已經證實此路不但行得通還很省錢!所以我的公司還沒破產倒閉就是明證!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180477315