OCR其實並不需要CNN，但CNN沒有OCR就完全沒用了！ - 鄉下老師

字體：小中大

OCR其實並不需要CNN，但CNN沒有OCR就完全沒用了！

2022/05/02 07:58:05瀏覽1474｜回應0｜推薦9

我很希望CNN(類神經網路)可以幫我更提升我的車牌辨識技術，天天都在研究，已經好幾年了！但是至今還是沒有任何收穫。我還沒放棄，還在鼓勵我的RD找到懂CNN的教授指導論文研究之中，但是他們都很謹慎退縮，我會繼續努力，但是我很希望大家分享我的經驗，知道這種對CNN的期待其實機會很渺茫，絕對不是大家在網路上看到的印象！好像CNN技術即將席捲影像辨識科技？我就在戰場前線，看到的完全不是這樣！

上面這張圖是用我的OCR車牌辨識核心完成的辨識，辨識時間24/18的意思是說：完成整個辨識的時間是24毫秒，從全圖中找到正確車牌位置的時間則是18毫秒！找到車牌之後我會將車牌作幾何形狀的正規化，再一一擷取其中的目標字元做字模比對，知道它是：LAE-6739這些內容，時間只需要6個毫秒！

大家覺得CNN很神奇的部分，其實主要是「抓到目標」！而不是辨識出來它們確實的內容！譬如在複雜的影像背景中看出裡面的一隻貓或狗等等！一旦抓到你想找到的目標之後，其實接下來需要做的工作都不是CNN可以作到的事情，而是OCR！所以你會在網路上看到很多CNN的神蹟，都只是抓到目標，至於後續確定那是甚麼狗？牠是躺著？或站著？等等其實都是OCR的技術，跟CNN完全無關的！

所以如果你要完成任何影像辨識的工作，沒有CNN或ML、DL的協助其實是完全沒問題的！但是如果沒有OCR技術的支持，即使你買齊了所有OpenCV、ML、DL、CNN的程式模組，你還是無法完成任何影像辨識工作的！我就沒有用上面這些任何一項的所謂AI模組，只是認真使用傳統基礎的OCR技術，就成就了我目前的事業，還做得很好！OCR當然還是影像辨識技術的基石主體，再過一百年還是一樣的！現在以機率統計為核心的所謂AI科技其實至今在影像辨識的領域還是成效未知的客人！

說到我的主業車牌辨識，唯一可能CNN能讓傳統OCR更好的部分，當然就是找到車牌的部分了！所以我可以讓CNN幫到我的忙的部分，就是前面說的18毫秒的搜尋車牌時間，是不是可以變成10毫秒或8毫秒了！先看看我目前是怎麼作的呢？

就是經過OCR教我的，灰階二值化挖出像是字元的目標，再排列組合一下，確定它們是一個車牌！我因此浪費了18毫秒！如果我要用CNN達到一樣的目的呢？我可以更快？更聰明？更有效率嗎？我天天都在期待！但是...

嚇死人了！即使我忽略訓練的耗時麻煩過程，光是使用已訓練完成的模式來辨識未知目標影像，準備接受辨識的影像，需要的預處理過程就鐵定要超過18毫秒了！沒有經過預處理，完成特徵分析的影像，當然就無法接受CNN的找目標辨識啦！

隨便看看CNN的演算法就知道，建立基礎特徵的計算就比OCR的灰階二值化計算複雜很多倍，當然也耗時很多倍！一定不只18毫秒，可能是180毫秒！你還能期望CNN比我用的OCR更快嗎？當然是慢到你會抓狂的！所以他們才會一直強調需要GPU幫忙解套了！但是OCR根本不需要GPU，還可以算得一樣好，還更快！

幫我想想吧！我有甚麼利基必須採用CNN？CNN的效益在哪裡？你知道嗎？你真的玩過嗎？你真的跟OCR方案比較過嗎？如果沒有，能不能審慎一點？不要像詐騙集團一樣亂講呢？

( 心情隨筆｜工作職場 )