網路城邦
上一篇 回創作列表 下一篇  字體:
OCR其實並不需要CNN,但CNN沒有OCR就完全沒用了!
2022/05/02 07:58:05瀏覽1474|回應0|推薦9

我很希望CNN(類神經網路)可以幫我更提升我的車牌辨識技術,天天都在研究,已經好幾年了!但是至今還是沒有任何收穫。我還沒放棄,還在鼓勵我的RD找到懂CNN的教授指導論文研究之中,但是他們都很謹慎退縮,我會繼續努力,但是我很希望大家分享我的經驗,知道這種對CNN的期待其實機會很渺茫,絕對不是大家在網路上看到的印象!好像CNN技術即將席捲影像辨識科技?我就在戰場前線,看到的完全不是這樣!

上面這張圖是用我的OCR車牌辨識核心完成的辨識,辨識時間24/18的意思是說:完成整個辨識的時間是24毫秒,從全圖中找到正確車牌位置的時間則是18毫秒!找到車牌之後我會將車牌作幾何形狀的正規化,再一一擷取其中的目標字元做字模比對,知道它是:LAE-6739這些內容,時間只需要6個毫秒!

大家覺得CNN很神奇的部分,其實主要是「抓到目標」!而不是辨識出來它們確實的內容!譬如在複雜的影像背景中看出裡面的一隻貓或狗等等!一旦抓到你想找到的目標之後,其實接下來需要做的工作都不是CNN可以作到的事情,而是OCR!所以你會在網路上看到很多CNN的神蹟,都只是抓到目標,至於後續確定那是甚麼狗?牠是躺著?或站著?等等其實都是OCR的技術,跟CNN完全無關的

所以如果你要完成任何影像辨識的工作,沒有CNN或ML、DL的協助其實是完全沒問題的!但是如果沒有OCR技術的支持,即使你買齊了所有OpenCVMLDLCNN的程式模組,你還是無法完成任何影像辨識工作的!我就沒有用上面這些任何一項的所謂AI模組,只是認真使用傳統基礎的OCR技術,就成就了我目前的事業,還做得很好!OCR當然還是影像辨識技術的基石主體再過一百年還是一樣的!現在以機率統計為核心的所謂AI科技其實至今在影像辨識的領域還是成效未知的客人!

說到我的主業車牌辨識,唯一可能CNN能讓傳統OCR更好的部分,當然就是找到車牌的部分了!所以我可以讓CNN幫到我的忙的部分,就是前面說的18毫秒的搜尋車牌時間,是不是可以變成10毫秒或8毫秒了!先看看我目前是怎麼作的呢?

就是經過OCR教我的,灰階二值化挖出像是字元的目標,再排列組合一下,確定它們是一個車牌!我因此浪費18毫秒!如果我要用CNN達到一樣的目的呢?我可以更快?更聰明?更有效率嗎?我天天都在期待!但是...

嚇死人了!即使我忽略訓練的耗時麻煩過程,光是使用已訓練完成的模式來辨識未知目標影像,準備接受辨識的影像,需要的預處理過程就鐵定要超過18毫秒了!沒有經過預處理,完成特徵分析的影像,當然就無法接受CNN的找目標辨識啦!

隨便看看CNN的演算法就知道,建立基礎特徵的計算就比OCR的灰階二值化計算複雜很多倍,當然也耗時很多倍!一定不只18毫秒,可能是180毫秒!你還能期望CNN比我用的OCR更快嗎?當然是慢到你會抓狂的!所以他們才會一直強調需要GPU幫忙解套了!但是OCR根本不需要GPU,還可以算得一樣好,還更快!

幫我想想吧!我有甚麼利基必須採用CNN?CNN的效益在哪裡?你知道嗎?你真的玩過嗎?你真的跟OCR方案比較過嗎?如果沒有,能不能審慎一點?不要像詐騙集團一樣亂講呢?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=173851663