模糊車牌辨識的訣竅就是：抓住已知線索，逐步搜出全貌！ - 鄉下老師

字體：小中大

模糊車牌辨識的訣竅就是：抓住已知線索，逐步搜出全貌！

2026/05/28 02:50:55瀏覽641｜回應0｜推薦4

作影像辨識的人會繼續研究相信必然成功的信心，我認為都是來自「人的眼睛真的看得到」！只要眼睛確實看得到，一定有物理科學上共通的邏輯，我只要能用數學與程式正確描述重製大腦裡面已經存在的辨識邏輯就一定可以完成這個AI工作了！

我常說現在影像辨識技術還在一個不成熟的階段，意思就是我們距離用演算法準確描述人眼識別目標的智慧還很遙遠！我們一般人腦袋中的辨識邏輯比所有已經存在的演算法都更為精緻複雜！也因為很多專家意識到這個複雜度很難一蹴可及，才會催生出深度學習這種東西，期待大數據的訓練可以讓AI奇蹟提前發生？

只是天不從人願！以辨識的速度、成本與正確率來說，目前深度學習的成效還是遠遠不如傳統影像辨識的研發！這就是我這種仍然堅持使用傳統影像辨識技術為研發主軸的廠商，還是能繼續活躍，甚至領先於各種影像辨識應用市場的原因！上面的模糊車牌辨識過程就是一個很好的例子！

在此好像傳統的OCR技術遇到了瓶頸？不管你怎麼操作灰階二值化，就是無法一次就正確的切割出所有的字元，不是太破碎就是沾連太嚴重！我的SOP其實最多也只能抓到KLA7四個字！但是當我們回頭看灰階圖時，信心就來了！闕漏的字眼睛確實是看得蠻清楚的！也就是說資訊一直都存在影像之中，雖然簡化後的二值化影像看不到，不表示不存在！必須回到較原始的資料影像中找而已！

所以我的程式就是用已經確認的KLA7等幾個字為線索，回到灰階圖上順藤摸瓜，先找到並確認緊鄰7字的6，之後再依序找到也確認3與8！就像警察辦案一樣，先抓住確定的線索深入追查就可以縮小可能嫌犯的範圍，在有前提的狀況下，模糊的目標也可以被大膽確認是車牌字元了！

所以我認為模糊狀態的辨識絕對是一個逐步推理搜索的過程！不可能有個神奇的遮罩運算，一套上去全圖掃描就可以直接正確辨識出一整組模糊車牌的！但這就是CNN與深度學習派人士的信念？還相信這麼複雜神奇的遮罩可以不必專家傷腦筋去精心設計，直接用大數據訓練就可以像古代的煉丹術士們幻想的一樣，只要用煉丹爐(GPU電腦？)燒個九九八十一天，就能練出仙丹了？

如此天真的幻想我只能祝他們好運了！我自己是寧願當步步踏實前進的烏龜啦！寓言中的龜兔賽跑每次都是烏龜贏嘛！下面就是我的實驗程式顯示的畫面，彩色的字就是我的SOP可以明確抓到的線索，後面的638三個黑字就是逐一被挖掘發現的灰姑娘們了！每一步驟都明確合理時，答案正確率就高了！而且辨識速度還是很快的！118萬畫素只需122毫秒！GPU就放在一邊涼快去吧！

( 心情隨筆｜ )