OCR可以做全套的車牌辨識，CNN只能做半套！ - 鄉下老師

字體：小中大

OCR可以做全套的車牌辨識，CNN只能做半套！

2023/11/30 08:13:00瀏覽1316｜回應0｜推薦8

直到目前多數的車牌辨識演算法都是從找「車牌」開始的！簡單說，就是找到全圖影像中具有車牌特徵的區塊，再進一步解析這個可能是車牌區塊內的字元關係。完整的車牌辨識當然不是只框出車牌的位置就行的！對使用者來說，車牌號碼是甚麼？才是最重要的目的，只告訴我車牌在影像中的位置？沒有用的。

但目前號稱影像辨識主流的CNN(類神經網路)技術，只擅長做前半段搜尋車牌的工作，真正要解析(辨識)車牌內容還是非使用傳統的OCR(光學字元辨識)技術不可！所以市面上可以找到車牌位置的半套CNN辨識模組很多，可以做完整辨識的卻很少！所以即使你是機器學習的信徒，也必須知道真的要做車牌辨識，OCR技術仍是不可或缺的主要辨識流程！CNN與DL(深度學習)頂多只是車牌辨識流程中可以選擇使用的一部份！

其實因為近年影像解析度大幅提高，多數影像中的車牌字元已經可以獨立清晰辨識了，如上圖的車牌字元就是粒粒分明！如同很多文件影像上面的印刷字，用OCR技術就可以直接辨識了！這種車牌如果還要套用找整個「車牌」的搜尋模式就是愚不可及了！

因為車牌與背景之間的邊界通常是不清晰不可靠的！如上圖其實就很難辨識出「車牌」的邊界。找車牌的演算法其實都是依靠字元與車牌底色之間的明顯亮度差異特徵。如果OCR都能直接找到字元了，為何還要費事用CNN去找整個車牌的模糊範圍呢？所以我相信未來直接找字元為基礎的車牌辨識演算法一定會變成主流！我在十年前就已經開始這麼作了！也一直獲得極佳的成效。

如果你的車牌辨識流程，在最耗時的全圖搜尋目標處理中，只能得到含糊的車牌概略位置？那是很浪費資源的！反之，一開始你就啟用OCR的技術，直接找出影像中可能的字元目標，你已經可以直接知道該目標是個甚麼字了！接下來你只要按照車牌的排列格式用幾何關係嘗試組織那些字元，如果可以拼湊出合乎正確格式的車牌，就像是打麻將胡牌，辨識成功了！

譬如東南亞車牌乃至香港大陸(甚至日本)車牌都是有單或雙排格式的！如果前處理搜尋全圖之後獲得的資訊只有一個框框，你就必須在這個框框內再做一次完整程序的OCR辨識，才能開始評估他們是單或雙排字的車牌！如果你完全捨棄CNN，直接用OCR技術解析全圖呢？

就如上圖，每個字元目標的資訊都很清晰完整，這就是標準的OCR程式可以做到的事情，有這麼精確完整的資訊，我當然很快就可以寫出程式拼湊這些字元的幾何位置關係，車牌號碼的答案很快就出來了！通常需要的辨識時間都會快到讓CNN望塵莫及！完全不需要用到GPU的！

所以我真的完全無法理解與接受「CNN已是影像辨識主流」技術的說法！至少在車牌辨識這個議題上，根本是用不到也不應該使用任何CNN技術的！我相信其他的車牌辨識商用軟體也不可能只用CNN與DL完成所有的辨識流程！硬要在這個議題上蹭ML、DL與CNN等狹義AI的熱度，就太矯情也太欺騙大眾了！

( 心情隨筆｜工作職場 )