順藤摸瓜，我的OCR就是這麼使用CNN來幫忙的！ - 鄉下老師

字體：小中大

順藤摸瓜，我的OCR就是這麼使用CNN來幫忙的！

2026/02/10 04:55:59瀏覽106｜回應0｜推薦5

這種清晰程度的車牌如果無法辨識當然是非常讓人無法接受的！但是以OCR為基礎的辨識技術來說，這真的是很尷尬很難辨識成功的案例！看看下面經過二值化切割後找到的獨立目標圖就知道，只有後面的118三個字可以被正確切割，其他的字都會與背景沾連無法被切割為獨立字元。

之前的版本，我在全圖搜尋可能是車牌的目標組合時，目標數下限是四個！也就是如上三個整齊排列的目標會被忽略，當然就不可能找到這個車牌了！為什麼會有這個四個目標的門檻限制？首先是為了減少運算量，其次是越少目標的組合要經過後續處理逐步切割、拚合甚至挖掘出所有的車牌字元，演算過程就會越複雜，出錯的機率也就越大，成功機率太渺茫的路線就先不考慮了！

但是當我以四目標為起點的運算架構都成熟穩定之後，我開始將門檻下修到三個目標的排列組合，當然會減少很多遺珠之憾，上面就是一個很經典的例子！好像是在一團亂絲之中找到一個頭緒，如果我認為118是某個車牌的一部份，我只要按照它們已經形成的規律，如字元的寬高與距離等等，往左右區間強制切割搜尋找出其他的字就可以了！

譬如從第一個1字往左在一個概略應該有字的小區間使用類似CNN的特徵矩陣Convolution運算方式，就可以很快找到一個清晰正確的8字了！確認有個8字之後再繼續嘗試往左搜尋，很快又可以找到M字了！依此類推，直到再往左就找不到字元符合度夠高的目標時就停止了！往右搜尋的過程也是一樣！

所以即使OCR的基礎運算只能直接找到七個車牌字元中的三個，我也可以仰賴CNN的技術把所有合理的字元湊齊！所以嚴格講我也是有使用CNN技術的！只是在此它們是OCR技術的配角與延伸，如果要在全圖中毫無前提的狀況下使用CNN搜索出所有的七個字元呢？那就會讓運算量大到需要YOLO技術來減量，即使如此都還是運算量大到非用GPU幫忙不可！我沒那麼笨的！那是一場大災難！而且是可以避免的！

所以不要再誤以為使用GPU是甚麼蓋高尚的AI策略了？他們其實是有苦說不出，因為演算法的效率太差，導致運算量太大才不得不用的！以影像辨識來說，我就是找到其他不必那麼多計算量的演算法解決了一樣的辨識問題！所以不要再誤以為我宣稱不用ML、DL與CNN就是不夠AI了！我其實是更有效率的AI研發者！買我的辨識軟體不必使用GPU還更快更準！你說是誰比較AI呢？

( 心情隨筆｜工作職場 )