就像配眼鏡調整度數一樣，二值化可以有不同的高低門檻！ - 鄉下老師

字體：小中大

就像配眼鏡調整度數一樣，二值化可以有不同的高低門檻！

2026/05/06 11:20:30瀏覽701｜回應0｜推薦16

這麼掉漆模糊的車牌是怎麼辨識成功的？如果以CNN(類神經網路)的概念就是假設圖上有某些英數字的字元，直接做地毯式的搜索掃描了！而且你不會事先知道字元是多大？所以可能要用不同大小的矩陣都做搜尋！那種運算量是大到很難想像的！所以在GPU加入這場影像辨識的戰爭之前，CNN是很難實作的！除非你有超級電腦。

我是用OCR方法做辨識的！就是先用某種策略判定每一個畫素是黑或白？如果那個策略剛好可以分辨字元的前景(黑)與背景(白)時，字元目標就會直接黑白分明的浮現出來了！我不必使用任何矩陣掃描，只要像描圖一樣找出目標的輪廓就可以很快辨識出那是甚麼字？或根本不是字了！

因為這種演算方式比起CNN只有數十到數百分之一的計算量！所以基本上我就完全不必使用GPU來幫忙的！CPU的計算能量就很夠用了！甚至因為計算資源充裕，碰到像上面這麼掉漆模糊的車牌時，我可以使用很多種二值化的策略，好像去配眼睛時調整度數一樣，看哪個度數看得最清楚就用那個度數配鏡了！

如上圖所示，我的標準軟體中其實有五六種二值化的策略，就像我的測試鏡片有五六種度數一樣！這樣找到模糊目標的機率當然就大增了！這裡所謂的「策略」不只是二值化時使用的灰階門檻高低而已，還包括是不是先對灰階影像作銳利化等處理！可以強化字元邊界讓字元更獨立分明！

重點是OCR如果使用得當效率是極高的！即使我用了那麼多種策略，總共的辨識時間對百萬畫素影像也不過才337毫秒，就是0.3秒左右，而且還不必呼叫使用GPU！這代表執行這種辨識軟體時，設備成本與電費都很節省的！這不是甚麼未來計畫或理念，就是我已經研發成功銷售中的產品能做的事！

知道了嗎？想要那麼聰明的AI影像辨識，你應該選擇又便宜又快又準又省電的OCR！CNN與DL等技術其實是辨識率較低成本還特別高的選項！不要只聽到AI頭就揮了！AI影像辨識的實作方式不是只有CNN與DL的！