字體:小 中 大 |
|
|
|
| 2026/02/02 15:10:01瀏覽96|回應0|推薦4 | |
自然情境街景影像中的車牌辨識困難之處一言難盡,首先我們不會預先知道車牌的大小,所以必須各種大小的目標都要考慮,光是這一點就讓使用CNN方法的目標搜尋相當頭痛了!他們要找到目標還是必須先假設目標大概多大,才能據以設計特徵矩陣去全圖搜尋的!所以速度絕對慢得要死!即使有YOLO等技術突破還是非常慢的!慢到必須有GPU幫忙才能達到一般人可以忍受的程度! 但是使用OCR就好多了!不必預先假設目標多大?就一次掃描就可以全部圈出來了!前提是二值化必須做得好,讓字元能與背景盡量分開!如上約30萬畫素影像即使很難辨識的案例也多半只需0.2到0.3秒!當然不必用GPU的啦!一般規格的電腦就可以輕鬆搞定!也因此真正全程用CNN與DL的車牌辨識其實是非常罕見的!因為實在太慢了! 而且找到車牌目標只是辨識全程的三分之一!找到之後還必須作非常精準的幾何校正,否則稍微歪斜的車牌就無法辨識了!這也是DL與CNN很不擅長的事情!上圖右邊是已經用OCR技術做好幾何校正的車牌灰階與二值化影像,大家可以感受到如果車牌字元很小,就是在20畫素高度以下時的艱難狀況!你只能面對處理一堆馬賽克的資訊! 這種狀況當然字元之間的空隙會很不明顯,尤其是經過JPG壓縮的影像會更糟糕!但很奇妙的,人的眼睛就是可以看得很清楚,也代表我的車牌辨識軟體也必須能夠正確辨識,否則就不好意思說自己是甚麼AI影像辨識了!此時很多統計學的概念就會被我使用了! 譬如即使字元無法粒粒分明,但是字元間隔處的灰階數值還是會較高(較亮),每個字元的概略寬度(除了1與I)及高度也應該是一樣的…等等等等!我的數學就是盡量用這些統計參數正確切割出字元的小影像,做最後的字元對比的!所以機器學習賴以為生的機率統計技術我也有用的!但是是在確定資訊都用完,進入到這麼模糊的區間時才會在有限範圍內使用的!我必須估計字元的寬高嘛! 最近拿到的一批停車柱拍的影像多數就是解析度較低的!也正好可以用來調整優化我這些底層的機率統計演算法的細節!上一批52張一開始是只能辨識正確一半,經過幾天調整就逼近90趴了!剛剛又取得五百多張類似影像,很興奮有得玩了!我的車牌辨識也會更進化了!
|
|
| ( 心情隨筆|工作職場 ) |












