網路城邦
上一篇 回創作列表 下一篇  字體:
時間標籤搞成這樣,比車牌辨識還難,碰到我兩天就搞定
2021/03/12 10:25:50瀏覽914|回應0|推薦8

有位客戶是做噪音監測的,他們會持續在某些地點錄影與監測噪音,如果在某時刻測到噪音,那個時間出現的車牌就是嫌犯了!但他們多半是做後處理的,就是要辨識錄影檔案中的車牌,當然車牌出現時間就必須是影像檔案中顯示的時間了!如果是下面這種標籤就還好,所以我一口答應可以替他們辨識時間標籤。

但是誰想到他們的標籤是美美半透明的格式!下圖就是一個極端難辨識的狀況,紅色半透明的標籤後面又剛好是一輛顏色相近的計程車,我的天啊!這簡直是要我辨識阿飄嘛!好像會比辨識車牌還要難了!差點反悔不做了,反正這部份沒額外收錢,是看在他說將有很多套訂單的分上才那麼爽快答應的!

但是好勝心強大的我怎麼能輕易認輸呢?還是跟他拚了!結果只用了兩天時間就達標了!他了給我540張這種有時間標籤的照片,最後百分之百都能辨識正確!厲害到我都開始佩服自己了!下面就簡單洩漏一下商業機密,等你通通學會時我剛好也要退休了,我的小孩都不愛玩這個,沒關係的!請享用!

這個辨識流程從灰階設計階段就有大學問,先是概略框出時間標籤的出現範圍,因為這個目標在影像中的位置是固定的,頂多是有點閃爍偏移幾個畫素而已,我需要做的是在此範圍內設計出一個跟畫面其他部分不一樣的辨識流程,從全彩到灰階的處理方式有無限多種,我們的選擇方向當然是讓字看起來最清楚啦!

大家想想,紅底白字加上會出現在背景分隔島上的樹木,這裡面甚麼色光是相對最暗的呢?RGB三選一,當然是藍光了!因為白色的字是RGB色光都強,其他背景中藍光最暗,如果我選擇藍光來辨識,不就可以得到最佳的字元對比度了嗎?加上一個負片處理,你看是不是比原始影像清楚多了!

二值化之後目標就都浮現了,當然此時動態二值化門檻是必須使用的!因為辨識區兩端與中間的亮度通常都有明顯的變化嘛!即使如此處理了,其實這張圖的中段也沒這麼乾淨的,在選擇區內,中間上方的色塊會與字元藕斷絲連,但是我用兩邊多數已能辨識的字元為基線就直接切開他們了!還有割痕可以看到。

接下來就是以目標應有的格式篩選,字元就全部呈現了!這樣就好了嗎?就可以達到各種意外都能處理的百分之百辨識率了嗎?當然沒那麼簡單!事實上那些字元常常會破碎或沾連,我必須建立一些邏輯將破碎的看成單一的字,將沾連的看成多個字元,分別去比對字模,它的字體當然與車牌又不一樣,還好只需辨識0-9的數字加一個斜線,做起來不必多久。

這個辨識在顏色對比方面處理的學問比車牌還要難,字元破碎的狀況也比車牌辨識時更多,但終究不如車牌辨識困難的原因,就在它的幾何部分比較簡單,不會傾斜或變形,可以假設目標就是水平的,所有字元都一樣高,字元間距規則也是固定的!可能的字元也只有數字而已。還有好多有的沒的常識可以參考,避免離舖的錯誤,譬如字元2殘缺時可能被辨識7,但如果它是在時與分的十位數位置,那就不可能是7,就「猜」它是2吧!準沒錯!

這些「人工智慧」我都在兩個工作天之內完成了!如果按照市場報價,這麼困難的辨識540張資料庫要到百分之百,即使照我的低廉報價也要拿個十幾萬吧?如果是那些吃人的AI公司就可以跟你要幾十萬,然後搞個一年半年都達不到99%!像我這種絕世高手呢?兩天就搞定了!還可以當贈品送給客戶欸!所以有影像辨識需求不來找我?你還想找誰呢?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=157513119