網路城邦
上一篇 回創作列表 下一篇   字體:
就像配眼鏡調整度數一樣,二值化可以有不同的高低門檻!
2026/05/06 11:20:30瀏覽91|回應0|推薦2

這麼掉漆模糊的車牌是怎麼辨識成功的?如果以CNN(類神經網路)的概念就是假設圖上有某些英數字的字元,直接做地毯式的搜索掃描了!而且你不會事先知道字元是多大?所以可能要用不同大小的矩陣都做搜尋!那種運算量是大到很難想像的!所以在GPU加入這場影像辨識的戰爭之前,CNN是很難實作的!除非你有超級電腦。

我是用OCR方法做辨識的!就是先用某種策略判定每一個畫素是黑或白?如果那個策略剛好可以分辨字元的前景()與背景()時,字元目標就會直接黑白分明的浮現出來了!我不必使用任何矩陣掃描,只要像描圖一樣找出目標的輪廓就可以很快辨識出那是甚麼字?或根本不是字了!

因為這種演算方式比起CNN只有數十到數百分之一的計算量!所以基本上我就完全不必使用GPU來幫忙的!CPU的計算能量就很夠用了!甚至因為計算資源充裕,碰到像上面這麼掉漆模糊的車牌時,我可以使用很多種二值化的策略,好像去配眼睛時調整度數一樣,看哪個度數看得最清楚就用那個度數配鏡了!

如上圖所示,我的標準軟體中其實有五六種二值化的策略,就像我的測試鏡片有五六種度數一樣!這樣找到模糊目標的機率當然就大增了!這裡所謂的「策略」不只是二值化時使用的灰階門檻高低而已,還包括是不是先對灰階影像作銳利化等處理!可以強化字元邊界讓字元更獨立分明!

重點是OCR如果使用得當效率是極高的!即使我用了那麼多種策略,總共的辨識時間對百萬畫素影像也不過才337毫秒,就是0.3秒左右,而且還不必呼叫使用GPU!這代表執行這種辨識軟體時,設備成本與電費都很節省的!這不是甚麼未來計畫或理念,就是我已經研發成功銷售中的產品能做的事!

知道了嗎?想要那麼聰明的AI影像辨識,你應該選擇又便宜又快又準又省電的OCRCNNDL等技術其實是辨識率較低成本還特別高的選項!不要只聽到AI頭就揮了!AI影像辨識的實作方式不是只有CNNDL的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=188437244