網路城邦
上一篇 回創作列表 下一篇   字體:
字模比對也包含人生哲學,正面思考能讓你更看清事實!
2026/03/04 05:08:02瀏覽151|回應0|推薦1

我整天在做一些一般人會覺得很神祕奧妙的影像辨識演算法的研究?但是從我自己的觀點,我是覺得我的數學思考是非常人性化,完全符合一般人的常識與直覺的!如果要說我有異於常人之處,只是我更能融會貫通物理原理、數學知識與我需要處理的影像問題而已!

譬如上例中我的程式可以輕易地準確抓到明明有一個大雜訊干擾的1字!我是怎麼辦到的?其實說穿了跟一般人的常識直覺是完全一樣的!就是只看我想要看的部分而已!我們公司師徒兩人(我與RD)的特異功能只是我們可以用數學與程式設計準確地表達出我們的想法與處理策略而已!

上圖就是我從原圖該位置抓出來的影像,與1字的特徵字模的並列比較。我的RD發明的這種特徵字模概念上是三色的!紅色點代表必然的前景點,就是預期一定在字元的正確筆畫之內的點!綠色點則是預期必然的背景點,就是預期一定不在字元筆畫區域內的點!其他點不論原圖是黑是白都不計分的!

正常時我們將這些關鍵點與目標影像比對,紅點對上目標影像的黑點,或是綠點對上目標影像的白點,都是加一分!反之,就是扣一分了!這個重要發明厲害之處是可以抓到重點辨識出字元的筆畫與背景,不會因為筆畫略粗或略細就產生很大的符合度分數的起伏!就像大多數人識字時也只會看筆畫的重點一樣!

厲害吧?這個技術當然是因為要解決我們自己實務上辨識字元符合度分數時會不穩定的問題而發明的!效果極佳!不只是辨識字元更準,還因為只需處理較少的關鍵點比對,連辨識速度都快了很多!但是碰到如上的明顯雜訊干擾時還是會失敗的!此目標影像與特徵字模數字0-9比對的分數如下圖:

這個比對的滿分是1000分,即使是最高分的4字也只有477分,簡單說就是它甚麼數字都不像!你根本無法判斷它可能是甚麼數字?但是如果我修改一下特徵字模比對的規則,只看符合筆畫的紅點計分,忽略背景綠點的計分呢?0-9的符合度就變成下圖這樣了!是不是非常清楚的就可以「看出」,這是一個1字!

 

而且這一招用到其他數字也都一樣有效的!如下圖,即使雜訊貫穿字元中央都不會讓我們判斷錯誤的!所以是不是很有趣?很像我們的現實生活中遇到很困難的狀況時,可以暫時忽略負面情緒與資訊,只做正面的思考觀察,就能清楚看到對我們有幫助的重要資訊,做出正確的判斷了!所以作影像辨識也是一種體悟人生哲學,修身養性的過程了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=186817420