網路城邦
上一篇 回創作列表 下一篇  字體:
敗部復活,找不到字元就找車牌嘛!
2018/11/02 06:25:02瀏覽1376|回應0|推薦7

這張看起來很清晰的車牌在我稍早的辨識程序下卻是死棋!原因是出在我的辨識程序是遵從OCR(光學字元辨識)的概念,就是先在影像中找出像是文字的目標,校正目標形狀→對比字元模型→再組織成車牌,最近閱讀世界最有名的車牌辨識軟體廠商ARH網頁,好像他們的辨識邏輯也大致是這樣的!他們有開放原始碼哦!當然不會像商業版那麼強。

OCR的程序有個前提,就是影像二值化時目標字元必須能切割成獨立目標,如上圖幾乎所有字元都與車牌的上下邊界若即若離藕斷絲連,幾乎沒有一個字可以直接被識別為獨立目標,這就慘了!沒有目標,哪來的字元辨識結果?偏偏香港車牌的雙排字車牌都是這個樣子!字元與車牌邊縫隙小到幾乎看不見!每張都要拿放大鏡來看嗎?

如果六個字中至少有兩三個字被識別出來,可以讓我看出車牌的特性與傾斜度,我還可以據此確認車牌的位置,然後作車牌邊緣的切割動作,將部分沾連的車牌字元切割出來,請參考侵入性的影像辨識資料處理,但是如果只有孤立一個的獨立目標,或根本沒有,我就真的沒轍了!

但是這畫面上明明車牌就很清楚啊!一般客戶絕對不會接受你的軟體居然無法辨識的!我也覺得如骨鯁在喉,就是想把它解出來,這時我就找我的RD一起傷腦筋腦力激盪。她果然已經出師了,幫我想出了一個符合人類直覺的思考方向,就是「車牌底色特別白」!一般我們都是找深色的字元目標,如果我們找「特別白」的區塊為目標,不就可以找到車牌位置了嗎?

這招果然有用,先找白色區塊目標,再鎖定應有的邊界做切割,所有字元就一顆顆獨立出來了!其實這個邏輯不算太奇特,就是一種「鎖定車牌」的運算,多數車牌辨識系統都是先找車牌再找內部字元的!不信你隨便翻幾篇台灣的車牌辨識論文看看,但他們都不是找白色區塊,而是黑白交錯的強烈對比資料點。

我又洩漏商業機密了嗎?沒關係的,歡迎分享!我希望大家都能對影像辨識建立一個全新的觀點,它不像IC製作或量子物理研究,是眼睛都看不到內容的東西,所以不必一定要建構在完全抽象的演算法上面。只是依據一般人的常識直覺為出發點,我們團隊的創新演算法天天都像寫作文一樣的源源不斷產生!

譬如昨天,我和RD在討論一個新的工程圖元件辨識的案子,她已經測試了幾天,發現我們既有的辨識流程都很難精準套用到這個辨識目的,我們毫不猶豫海闊天空的想像著完全不同的辨識理想切入點,最終決定模仿指紋辨識的邏輯,以圖上的節點:端點、交叉點與轉折點為辨識資料基礎。

誇張的是我們完全沒做過類似的辨識流程,也不打算去找一大堆資料研究指紋辨識的既有技術,就是簡單的打掉重做,邊走邊瞧。我們常幹這種事情,每次也都有很好的結果,面對要建構一個一般實驗室可能要一兩年才能做出雛形的新技術,我們不但不焦慮,還很興奮!這一定很好玩!前提對了就不可能沒有結果。

所以,如果我們像學術界人士的想法一樣,覺得論文發表很重要,一點點小聰明小發現就敝帚自珍猛寫論文,還想申請專利甚麼的!那就太浪費生命了!正事(解決問題)不幹搞那些幹嘛?如果學他們的玩法,我們絕對可以輕易超越任何頂尖大學的影像辨識研究團隊。沒有論文素材嗎?到我們公司的垃圾桶找找,很多的!任何人拿去我就當作是做資源回收,都是創新,但不保證能解決問題。

我真的很想告訴學界那些人:研究不是那樣做的!別浪費台灣菁英師生的研發能量了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=119155343