網路城邦
上一篇 回創作列表 下一篇   字體:
如果招牌也來亂怎麼辦?
2024/11/09 03:22:57瀏覽216|回應0|推薦5

這個辨識結果當然有錯誤,雖然看似陰暗的車牌都辨識到了,但對街的商店招牌也被當作車牌了!這在街景中的車牌辨識來說是常態,如果你的車牌辨識只是在停車場出入口拍成車牌特寫的影像中來使用,當然絕對不會有這種問題!要在複雜的街景中自動排除各式各樣很像車牌的目標,還加上拍攝角度的多變,光線陰影的變化,那就是完全不同層次的技術了!

所以停車場的車牌辨識,現在的高中生拿著OpenCV之類的工具程式庫組裝就可以做得不錯了,毫無技術難度可言!正因為如此,我的聰明辨識軟體跟任何廠牌的軟體在停車場情境PK,辨識率的差異都很小,誰賣得好?只是看價格與廣告而已,我當然是沒有優勢的!

也因此當年只花了兩年就做出可以在停車場使用的車牌辨識軟體,但是做街景的車牌辨識呢?現在已經做到第十年了,還有非常多狀況需要繼續研究!我的車牌辨識生意也是靠這些高技術的使用情境才能持續活到現在的!如果只靠停車場的市場,我這種小公司早就被大公司們擠出市場了!

所以當你看到很多車牌辨識廣告時,請注意看他們展示的成果,即使是在馬路上,如果他們刻意避開難辨識的街景背景?或是不敢面對斜視傾斜變形的車牌,那就只是一般水準的技術了!因為實際在街上使用這些軟體時,使用者通常無法避免會拍到複雜背景,也常被迫只能拍到很斜視的車牌,如果你買的軟體無法應對這些狀況,買回去就是找氣受的!如果有人說車牌辨識已經是很成熟簡易的科技,那就是騙你放心買爛貨的陷阱

這些複雜的狀況要通通處理好,絕對是不能依賴機器學習的!因為他們只是統計學!首先,特殊狀況不可能有「巨量資料」供你做學習訓練!其次處理特殊狀況的邏輯複雜各自不同,即使是深度學習勉強可以做到,成本也會高得嚇人!做出的複雜模式執行時也需要超級電腦才能跟上需要的辨識速度!

如上的案例在台灣要處理就很簡單,因為純英文的商店招牌不符合任何合法的車牌格式,辨識到就直接忽略不輸出了!但是在柬埔寨是可以有自訂車牌的,只要總字數不超過八個字都合法的!如果需要加上辨識車子的形狀範圍來確定是否車牌?那成本又太高了!所以這個案例我才會提出跟客戶討論!

當然他們也想不出甚麼好辦法,最終還是靠我對物理事實與影像資料的精準理解掌握才想出對策解決的!首先是我發現他們的車牌字型比較瘦長,正面直視時高度與寬度的比例是2.16倍,如果左右斜視時比例還會更高,除非是俯瞰時比例才會小於2.16即使是自訂車牌也必須遵守這個字型規範的

如果有一個如上的純英文可疑車牌辨識結果,字串中的字元高寬比明顯小於2.16倍,就是字型較胖,商店招牌為了大方好看通常是這樣的!此字串又位於影像畫面的上半部,那就不可能是「俯瞰」的角度了!所以根據這些事實跡象與格式判斷,就絕對不可能是車牌了!

好玩吧?我的軟體中就是暗藏著非常多這類精緻的人工智慧(AI),才能對那麼多複雜背景中疑似車牌的雜訊「視若無睹」的!加上這個判斷邏輯後他們的店招牌就幾乎完全不會被誤認了!想像一下,不管你怎麼拍街景中的車牌,招牌都不可能在畫面下方的!位在中間都不太可能!考慮這個條件,招牌之亂就不是問題了!

有趣的是:這個邏輯不只跟「影像」資料本身有關,還加上一些物理現象與常識的理解與掌握!所以我才會常常說:影像辨識不只是「影像」的辨識,而是一個類似CSI的犯罪現場調查!這些工作當然絕對不是機器學習、深度學習或類神經網路可以做到的!他們的演算法永遠只會考慮影像資料的本身而已!所以你還認為使用MLDLCNN技術的開發團隊比我更AI嗎?跟我相比,他們笨死了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181304101