字體:小 中 大 | |
|
|
2015/05/26 15:24:14瀏覽4748|回應0|推薦12 | |
很多人看我天天寫部落格,還當老闆四處趴趴走,會對我的日常生活內容有所誤解。其實寫程式研究影像辨識技術才是占掉我大部分上班時間的事情,我仍舊是個很勤勞的研究人員!很像一個博士生!因為多數客戶不喜歡公開業務內容,所以很多研發我不便公開在部落格談。但單純的技術研究,不涉及客戶業務的就沒關係了!而且真的很好玩! 下面就是一個最近在忙的問題,有人希望我寫個影像辨識APP,辨識如下的牌子,但是拍攝環境是通常有點暗的倉庫,手機就只好打光幫忙了,但是一打光就會中間亮兩邊暗。 接著做二值化,就是定出一個亮度,此亮度以上為背景(白),以下為字元(黑),想將字元抓出來,就會變成這樣: 哇!抓不齊全,任何單一的亮度門檻值都不對!都沒辦法抓到全部的完整字元。所以就想出一個動態門檻值的程式,大致上是看目標附近的平均亮度來決定誰是黑誰是白?首先就是要算出影像上區域的亮度變化,專業術語是低通濾波: 依據上圖做出來的二值化結果不錯: 但是有個問題,就是要算出低通濾波圖(矩陣)非常耗時,比我辨識文字(車牌)的時間還久!約半秒鐘(500ms)。所以就繼續努力,設法讓低通濾波的計算更有效率,快速一點,結果如下: 這張圖的計算只需要50ms是原來的十分之一,搭配我原本大約200ms的字元辨識時間,就和正常光源下的全程辨識時間差不多了!二值化效果其實似乎更好:
歡迎大家參觀我的辦公桌囉! |
|
( 心情隨筆|工作職場 ) |