車牌字小難辨識的原因看這裡就知道了！ - 鄉下老師

字體：小中大

車牌字小難辨識的原因看這裡就知道了！

2026/02/02 15:10:01瀏覽96｜回應0｜推薦4

自然情境街景影像中的車牌辨識困難之處一言難盡，首先我們不會預先知道車牌的大小，所以必須各種大小的目標都要考慮，光是這一點就讓使用CNN方法的目標搜尋相當頭痛了！他們要找到目標還是必須先假設目標大概多大，才能據以設計特徵矩陣去全圖搜尋的！所以速度絕對慢得要死！即使有YOLO等技術突破還是非常慢的！慢到必須有GPU幫忙才能達到一般人可以忍受的程度！

但是使用OCR就好多了！不必預先假設目標多大？就一次掃描就可以全部圈出來了！前提是二值化必須做得好，讓字元能與背景盡量分開！如上約30萬畫素影像即使很難辨識的案例也多半只需0.2到0.3秒！當然不必用GPU的啦！一般規格的電腦就可以輕鬆搞定！也因此真正全程用CNN與DL的車牌辨識其實是非常罕見的！因為實在太慢了！

而且找到車牌目標只是辨識全程的三分之一！找到之後還必須作非常精準的幾何校正，否則稍微歪斜的車牌就無法辨識了！這也是DL與CNN很不擅長的事情！上圖右邊是已經用OCR技術做好幾何校正的車牌灰階與二值化影像，大家可以感受到如果車牌字元很小，就是在20畫素高度以下時的艱難狀況！你只能面對處理一堆馬賽克的資訊！

這種狀況當然字元之間的空隙會很不明顯，尤其是經過JPG壓縮的影像會更糟糕！但很奇妙的，人的眼睛就是可以看得很清楚，也代表我的車牌辨識軟體也必須能夠正確辨識，否則就不好意思說自己是甚麼AI影像辨識了！此時很多統計學的概念就會被我使用了！

譬如即使字元無法粒粒分明，但是字元間隔處的灰階數值還是會較高(較亮)，每個字元的概略寬度(除了1與I)及高度也應該是一樣的…等等等等！我的數學就是盡量用這些統計參數正確切割出字元的小影像，做最後的字元對比的！所以機器學習賴以為生的機率統計技術我也有用的！但是是在確定資訊都用完，進入到這麼模糊的區間時才會在有限範圍內使用的！我必須估計字元的寬高嘛！

最近拿到的一批停車柱拍的影像多數就是解析度較低的！也正好可以用來調整優化我這些底層的機率統計演算法的細節！上一批52張一開始是只能辨識正確一半，經過幾天調整就逼近90趴了！剛剛又取得五百多張類似影像，很興奮有得玩了！我的車牌辨識也會更進化了！

( 心情隨筆｜工作職場 )