網路城邦
上一篇 回創作列表 下一篇   字體:
模糊車牌辨識的訣竅就是:抓住已知線索,逐步搜出全貌!
2026/05/28 02:50:55瀏覽52|回應0|推薦0

所有作影像辨識的人應該都跟我類似吧?我們會繼續研究相信必然成功的信心都是來自「人的眼睛真的看得到」!只要眼睛確實看得到,一定有物理科學上共通的邏輯,我只要能用數學與程式正確描述重製大腦裡面已經存在的辨識邏輯就一定可以完成這個AI工作了!

我常說現在影像辨識技術還在一個不成熟的階段,意思就是我們距離用演算法準確描述人眼識別目標的智慧還很遙遠!我們一般人腦袋中的辨識邏輯比所有已經存在的演算法都更為精緻複雜!也因為很多專家意識到這個複雜度很難一蹴可及,才會推生出深度學習這種東西,期待大數據的訓練可以讓AI奇蹟提前發生?

只是天不從人願!以辨識的速度成本正確率來說,目前深度學習的成效還是遠遠不如傳統影像辨識的研發!這就是我這種仍然堅持使用傳統影像辨識技術概念的廠商,還是能繼續活躍,甚至領先於各種影像辨識應用市場的原因!上面的模糊車牌辨識過程就是一個很好的例子!

在此好像傳統的OCR技術遇到了瓶頸?不管你怎麼操作灰階二值化,就是無法一次就正確的切割出所有的字元,我的SOP其實也只能抓到KLA7四個字!但是當我們回頭看灰階階段的圖時,信心就來了!眼睛確實是看得蠻清楚的!資訊一直都存在影像之中,雖然簡化後的二值化影像看不到,不表示不存在!

所以我的程式就是用已經確認的KLA7等幾個字為線索,回到灰階圖上順藤摸瓜,先找到並確認緊鄰7字的6,之後再依序找到也確認38!就像警察辦案一樣,先抓住確定的線索深入追查就可以縮小可能嫌犯的範圍,在有前提的狀況下,模糊的目標也可以被大膽確認是車牌字元了

所以我認為模糊狀態的辨識絕對是一個逐步推理搜索的過程不可能有個神奇的遮罩運算,一套上去全圖掃描就可以直接正確辨識出一整組模糊車牌的!但這就是CNN與深度學習派人士的信念?還相信這麼複雜神奇的遮罩可以不必專家傷腦筋去精心設計,直接用大數據訓練就可以像古代的煉丹術士們幻想的一樣,只要用煉丹爐(GPU電腦?)燒個九九八十一天,就能練出仙丹了

如此天真的幻想我只能祝他們好運了!我自己是寧願當步步踏實前進的烏龜啦!寓言中的龜兔賽跑每次都是烏龜贏嘛!下面就是我的實驗程式顯示的畫面,彩色的字就是我的SOP可以明確抓到的線索,後面的638三個黑字就是逐一被挖掘發現的灰姑娘們了!每一步驟都明確合理時,答案正確率就高了!而且辨識速度還是很快的!118萬畫素只需122毫秒!GPU就放在一邊涼快去吧!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=189325981