敗部復活，找不到字元就找車牌嘛！ - 鄉下老師

字體：小中大

敗部復活，找不到字元就找車牌嘛！

2018/11/02 06:25:02瀏覽1376｜回應0｜推薦7

這張看起來很清晰的車牌在我稍早的辨識程序下卻是死棋！原因是出在我的辨識程序是遵從OCR(光學字元辨識)的概念，就是先在影像中找出像是文字的目標，校正目標形狀→對比字元模型→再組織成車牌，最近閱讀世界最有名的車牌辨識軟體廠商ARH網頁，好像他們的辨識邏輯也大致是這樣的！他們有開放原始碼哦！當然不會像商業版那麼強。

OCR的程序有個前提，就是影像二值化時目標字元必須能切割成獨立目標，如上圖幾乎所有字元都與車牌的上下邊界若即若離藕斷絲連，幾乎沒有一個字可以直接被識別為獨立目標，這就慘了！沒有目標，哪來的字元辨識結果？偏偏香港車牌的雙排字車牌都是這個樣子！字元與車牌邊縫隙小到幾乎看不見！每張都要拿放大鏡來看嗎？

如果六個字中至少有兩三個字被識別出來，可以讓我看出車牌的特性與傾斜度，我還可以據此確認車牌的位置，然後作車牌邊緣的切割動作，將部分沾連的車牌字元切割出來，請參考侵入性的影像辨識資料處理，但是如果只有孤立一個的獨立目標，或根本沒有，我就真的沒轍了！

但是這畫面上明明車牌就很清楚啊！一般客戶絕對不會接受你的軟體居然無法辨識的！我也覺得如骨鯁在喉，就是想把它解出來，這時我就找我的RD一起傷腦筋腦力激盪。她果然已經出師了，幫我想出了一個符合人類直覺的思考方向，就是「車牌底色特別白」！一般我們都是找深色的字元目標，如果我們找「特別白」的區塊為目標，不就可以找到車牌位置了嗎？

這招果然有用，先找白色區塊目標，再鎖定應有的邊界做切割，所有字元就一顆顆獨立出來了！其實這個邏輯不算太奇特，就是一種「鎖定車牌」的運算，多數車牌辨識系統都是先找車牌再找內部字元的！不信你隨便翻幾篇台灣的車牌辨識論文看看，但他們都不是找白色區塊，而是黑白交錯的強烈對比資料點。

我又洩漏商業機密了嗎？沒關係的，歡迎分享！我希望大家都能對影像辨識建立一個全新的觀點，它不像IC製作或量子物理研究，是眼睛都看不到內容的東西，所以不必一定要建構在完全抽象的演算法上面。只是依據一般人的常識直覺為出發點，我們團隊的創新演算法天天都像寫作文一樣的源源不斷產生！

譬如昨天，我和RD在討論一個新的工程圖元件辨識的案子，她已經測試了幾天，發現我們既有的辨識流程都很難精準套用到這個辨識目的，我們毫不猶豫海闊天空的想像著完全不同的辨識理想切入點，最終決定模仿指紋辨識的邏輯，以圖上的節點：端點、交叉點與轉折點為辨識資料基礎。

誇張的是我們完全沒做過類似的辨識流程，也不打算去找一大堆資料研究指紋辨識的既有技術，就是簡單的打掉重做，邊走邊瞧。我們常幹這種事情，每次也都有很好的結果，面對要建構一個一般實驗室可能要一兩年才能做出雛形的新技術，我們不但不焦慮，還很興奮！這一定很好玩！前提對了就不可能沒有結果。

所以，如果我們像學術界人士的想法一樣，覺得論文發表很重要，一點點小聰明小發現就敝帚自珍猛寫論文，還想申請專利甚麼的！那就太浪費生命了！正事(解決問題)不幹搞那些幹嘛？如果學他們的玩法，我們絕對可以輕易超越任何頂尖大學的影像辨識研究團隊。沒有論文素材嗎？到我們公司的垃圾桶找找，很多的！任何人拿去我就當作是做資源回收，都是創新，但不保證能解決問題。

我真的很想告訴學界那些人：研究不是那樣做的！別浪費台灣菁英師生的研發能量了！

( 心情隨筆｜工作職場 )