網路城邦
上一篇 回創作列表 下一篇  字體:
不好意思,有些字我是用猜的!
2016/02/23 04:09:44瀏覽1059|回應0|推薦12

最近正在積極研究大陸出牌辨識,其實多種車牌(自小客、港澳、營業車與警車)的辨識程序也都作好了!但是對於稍微模糊的中文字常常會有離譜的辨識結果感到不太滿意,原因是中文字筆畫太密集了,要依賴標準字模的筆劃符合度來穩定辨識中文字真的是阿婆生子,很拚的!

換言之,如果字夠大夠清楚當然沒問題,但是解析度稍低或筆畫略有沾連的中文字就可能會錯得很離譜了!譬如簡單的「京」字都可能辨識成筆畫複雜的「蒙」字,原因只是那個京字原始影像比較模糊,經過處理之後筆畫太粗了而已。

我知道人眼在辨識中文時,參考的資訊遠多於一般影像辨識的字模比對,除了看筆畫的位置之外,也會參考筆畫的密度與趨勢(向量),譬如我們會看「部首」的概念,就是其中之一!與辨識英數字不同之處是:中文字在我們的視覺判斷中常常不只是一個單一連續的目標,而是好幾個可能分離的目標。如果可以建立文字的數學特徵,如上下離斷、左右分開、頭重腳輕或左輕右重等等傾向來協助辨識,應該都會很有幫助!

我一開始就有這個概念,但是我的程式是延續自只有英數字的台灣車牌辨識,我確實有建立了一些文字特徵幫忙辨識,但是那些特徵對中文字是不太合用的!上周終於有空專心的建立了多個針對中文特徵辨識的演算法,現在筆跡模糊的字也可以「猜」得蠻正確了!

但是可能真的操過頭了!經過一周忙碌加上週末連續加班後,昨天身體狀況大崩盤:先是背痛,接著牙痛、頭昏、咳嗽、撐了半天還是決定下午回家看醫生,到了晚上還加碼肚子痛!這個中文字特徵強化辨識的發明代價還真的好大!幸好一早起來各種症狀緩解很多,應該就是需要休息而已。

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=47690272