網路城邦
上一篇 回創作列表 下一篇   字體:
影像辨識是科學解題的智慧,機器學不會的!
2024/06/27 04:13:35瀏覽524|回應0|推薦6

我的車牌辨識頗受市場好評,全台灣所有路邊停車開單收費管理公司的車牌辨識軟體都是買我的!因為手拍的車牌影像距離雖近解析度清晰度很好,但是角度變化很大,總不能讓開單員每次都要蹲下正面拍車牌吧?人家很忙趕時間的!能夠站著隨手拍都辨識率很高的車牌辨識你不用找了!全台灣只此一家別無分號!南港園區高軟園區都沒賣,只有台南本公司有賣!

但是真實世界可以讓車牌無法辨識的原因千奇百怪,我的軟體也不是無所不能的!昨天就有一家管理公司在去年升級軟體後說辨識率提高很多,他們很滿意,但還是有些無法辨識的案例,不知道我願不願意研究看看?我當然說好!我的軟體就是靠著研究這些客戶回饋的失敗案例越來越強的!我從來不想迴避問題自我陶醉,我只想要給自己和客戶更好的科技!

他們立即提供了數百張辨識失敗的照片,其中大部分都是這種因為正午時分的陰影籠罩車牌而無法正確辨識的!這確實是我使用OCR技術辨識的一個罩門弱點!我們是假設車牌就是白底黑字,用二值化技術切開字元與背景是所有處理的起點,如果陰影干擾嚴重,我無法正確切割出字元就提前出局了!

理論上CNN(類神經網路)是可以解決這種問題的,它們是跳過切割影像的步驟,直接從全圖掃描字元特徵的!但是它們必須假設車牌是個水平的矩形,不然所有傾斜變形都要設計不同的特徵矩陣搜尋,找個車牌就會找到天荒地老了!所以至今那些所謂的AI技術都還無法做出歪斜辨識率與我的產品相似的成果,效能太差成本也太高毫無競爭力,只能繼續在實驗室徘徊。

老實說,如果陰影嚴重到一個程度我也無法從全圖中找到車牌位置的!連車牌都無法鎖定當然就是直接宣告失敗了!但是昨天客戶給我的這類案例中,有大約一半是有抓到車牌的,如下圖,只是因為陰影干擾,車牌字元會辨識錯誤,最常見的就是1字上面有橫向的陰影就會變成T字了!

但是從上面PhotoShop軟體的分析介面大家就可以看到,從數學或物理的角度看,陰影與字元的亮度多數還是可以明確區別的!所以如果我能夠準確抓到低於陰影區但高於字元區的亮度門檻值,我的車牌經過處理就會變得很清晰正確好辨識了!如下圖陰影就被完全排除了!辨識答案當然就會正確了!

所以我很迅速的調整優化這一部份的程式,很快就從失敗的三百多個案例中「救回」了四成的案例!也立即免費替客戶更新程式!這就是我的效率與服務品質!所以我的客戶只要買過我的產品從來就不會再考慮買別家了!我想說的重點是:這就是使用精準科學開發影像辨識能做到的事情!用鬼話連篇的甚麼AI機器學習是絕對做不到的

現在多數沒買過我的產品來洽詢的客戶幾乎都是被AI詐騙洗腦過的!滿腦子以為影像辨識都是用機器學習作的?所以開口閉口都是請問需要多少資料來「訓練」之類的傻話!連他們自己在說甚麼都不知道?只是引用詐騙集團的話術跟著亂講而已!事實上市面上根本沒有真的用機器學習作的車牌辨識商品!如果廠商說有,只是亂蹭AI熱度而已!事實是:用機器學習根本做不出辨識率高於90%的東西!

像上面我用的這種資料處理技術與解決問題的方式是不需要用大量資料訓練的!只要有幾個類似資料讓我可以確實分析掌握問題的關鍵就夠了!我也不必把客戶提供的數百張資料拿到甚麼學習模型中去攪拌!所以就像醫生看病,望聞問切找到病因之後對症下藥就可以了!

我依據幾個案例設計出合理的過程,確定可行之後就拿去測試幾百個資料,如果病因一樣就可以治好,不一樣就還是失敗,我會放到待處理目錄繼續找出它們不同的病因,設計新的藥方!這就是精準科學的方式!機器學習只是知其然不知其所以然的機率統計學,即使抓瞎把病治好了,都無法跟你說明病情病因的!更糟的是他們很浪費資源與時間!開發者與客戶都會賠錢的!

所以我一邊賣影像辨識產品,其實也一邊在當老師,導正客戶對於影像辨識的很多錯誤觀念!機器學習是統計學,理論上就不是可以做到高精準度的技術,但是所有影像辨識的應用都需要至少95%以上的辨識率,這本來就是機器學習先天條件上就無法達到的目標!那些使用機器學習的公司會要你相信:只要收集的資料夠多,執行的訓練夠多你就可以得到極高的辨識率?這就像要你相信只要不斷訓練你的雙腿,你遲早可以跑贏汽車一樣的荒謬!這種事情至今從未發生,以後也不會發生!

重點是:我確實可以充分用我的產品與服務證明我的說法!是機器學習必須更努力來證明自己,來否定我的論點的時候了!不要再閃躲了!拿出幾個像樣的產品(商品)來吧?別老是躲在實驗室或補習班高唱AI自嗨了吧?做不出實用產品的AI技術就是詐騙無誤!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180758201