網路城邦
上一篇 回創作列表 下一篇  字體:
這種模糊又傾斜的影像,用OCR或CNN都很難處理的!
2024/07/09 15:51:04瀏覽418|回應0|推薦2

這幾張辨識夠難夠嗆了吧?基本上要辨識它們的技術只有兩種,一是傳統上習慣使用的OCR,現在大家瘋迷的則是CNN類神經網路。但是上面幾個例子是可以重創兩種主流方法的惡魔!因為模糊導致切割字元目標極為困難,OCR的運作就很難順暢!

CNN比較不怕模糊,但是碰到傾斜度無法預期的行列目標就點中CNN的死穴了!要用全圖掃描(Convolution)的方式找到未知大小與傾斜度的字元或車牌,運算量就會大到非求救於GPU不可了!對於使用者來說就是要花大錢讓電腦升級還要多繳很多電費了!

那我是怎麼作到可以辨識它們的呢?基本上我相信只要人眼人腦可以辨識的目標,我們總是可以想出演算法來模擬模仿辨識出來的!如果以上述兩大主流方法為基礎,應該只要硬著頭皮走下去,兩種方式的進階變形繼續抝下去終究都可以達到目的的!

我是靠OCR技術起家的,也深知CNN等技術需要的運算量太大,不適合使用於需要高效率速度的商用車牌辨識軟體,所以我當然就是從OCR這條路闖進去最終可以成功的!我找車牌的基本方式是先嘗試盡量切割出車牌字元,再依據它們的排列方式做幾何校正,以對付車牌的傾斜變形!

問題是當影像如此模糊時任何一種二值化的策略都不能保證能得到理想的字元目標組,那就只能多用幾種策略試試看,找到最好的結果了!也就是在這種情況下,我也會像機器學習派一樣採用嘗試錯誤的策略的!當然為了避免無謂的試算浪費資源,我會盡量優先使用成功機率最高的策略,如果進行順利就不做較低順位的策略嘗試了!

所以各種演算法技術並沒有絕對的優劣高下,只有在問題性質與整體成本效益考量下,哪種方法較為適合的比較!我已經從OCR這一邊突破披荊斬棘地走出一條路來了!就看使用CNN的專家們是不是也能從CNN出發做出跟我一樣的辨識能力,那時就可以比較兩條路的效率與辨識率了!

當然CNN總是很高調表示他們是無所不能的!但是我確實沒看過他們提出過跟我的軟體辨識能力相近的商業產品!在此我只想明確告訴大家「我」可以做到的事情,也都會立即實作呈現於我銷售的辨識軟體上!需要這種辨識能力的人,只要來找我買就有了!甚至可以先試用過後再買!沒有任何人會被欺騙的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180796958