字體:小 中 大 | |
|
|
2025/01/10 15:10:12瀏覽66|回應0|推薦0 | |
如此清晰的車牌要辨識出來應該是理所當然的,但是我很尷尬地告訴大家,在今天中午之前我就是辨識不出來!為何如此?請看下面的二值化圖: OCR技術的基礎程序就是要在二值化圖中切割出獨立目標,如果必須被分割的目標,如字元與底線之間真的有些微的空隙,解析度也足夠,即使間隙狹小都還能經過影像處理強化邊界對比切割成功,即使不同意義的目標真的相連,只要顏色有差異也還是可以切割的!但是上面這張影像中的底線與字元之間是真的完全沒有間隙的!連顏色都幾乎一樣是深藍色的! 人的腦袋可以抽象思考,因為我們認得英數字,所以可以直接抽取出字元,忽略那條底線,但要寫出這種程式的概念比較類似CNN,我又因為CNN的計算量太大而非常不願使用,如果只是兩三字的沾連或串連,我都還有基於OCR的補救技術,但是碰到到這種極端的狀況,所有字元直接串成一串螃蟹?就算是被將軍死棋了! 這種情況雖然極為少見,但是柬埔寨的車牌真的預設就是有那條底線的!法律也沒規定底線必須與字元分得很開,所以上面這個車牌完全是合法的,卻讓大多數以OCR技術為基底的車牌辨識軟體非常困擾,更尷尬的是:一般人根本無法理解這摸清楚的車牌怎麼會無法辨識?賣車牌辨識的人就尷尬了! 其實我已經使用了非常多柬埔寨車牌的影像資料,也只有這張剛好點中了我的死穴!但是好像我的守護神有聽到我的禱告?中午午睡起床立即靈光一現,想到解法了!如下圖,我現在可以區別這種討厭的連線與真正的字元筆畫了!雖然看得出來沒有清得很乾淨,但是已足夠看出車牌字元的群組,不會找不到車牌了! 至於是如何做到的具體步驟?就先賣個關子!只能提示大家那種連線一定有跟正常字元筆畫不同的數位特徵!只要能想到也用程式找到這些差異,就可以精準切斷連線了!解法也可能不只一種!所以只要加上一些巧思,幾乎所有OCR的缺點都是可以補救的!我到現在都還沒被迫改用效率極低的CNN,獲得的最大好處當然就是我的辨識軟體計算量合理,速度極快!也非常精確!所以我才能繼續嘲笑那些深陷在ML、DL與CNN地獄中難以自拔的同行啊! |
|
( 心情隨筆|工作職場 ) |