網路城邦
上一篇 回創作列表 下一篇  字體:
歹勢!這張我沒把握辨識成功!
2020/12/03 04:24:41瀏覽998|回應0|推薦5

最近在研發幾千萬畫素的街景車牌的辨識核心,主要問題有兩個!一個是畫面中要辨識的車牌目標距離遠近落差很大,在物理限制下,一張影像的焦距只有一個,也就是只能讓特定的距離達到最清晰的程度,比這個理想焦距近或遠的車牌難免會稍微失焦模糊!常有顧客問我:「要多大的解析度才能辨識到車牌?」我回答這個問題時都很掙扎,第一是「影像解析度」不是問題,因為我們辨識的目標是車牌,所以「車牌的大小(畫素單位)才是正確的問題。即使如此,「多少畫素大小的車牌才能辨識?」還是一個很難回答的問題!

像上面影像中的車牌字元只有15個畫素的高度,但是百分之百可以正確辨識,最上面較模糊影像中的車牌字元高度近40畫素了,我卻依舊無法穩定辨識成功,正確地說是「偶爾可以碰運氣辨識成功!」但今天重點不是打廣告,我不想刻意的PO出不穩定的辨識成功案例,只想老實告訴大家這種模糊辨識的實際障礙與困難原因。

上面兩例辨識難易差異的原因只是影像焦距對或不對?越是失焦的影像我就需要更多畫素達成辨識任務!但是焦距準不準對於一般客戶來說是很難量化的一個條件,當我被迫說出一個標準時,就只能說:「不失焦的前提下,20畫素可以辨識!除了焦距之外,夜間拍攝的影像還有一個問題,也充分顯示於最上面的那張影像。我把背景部分放大給大家看:

原本應該是簡單全黑的夜間馬路地面,居然會變成這個色彩豐富的樣子!為什麼?這裡面暗藏了攝影機製造成本的問題,攝影機品質相關的最大成本其實是感光元件!感光度很好,元件密度很高的攝影機,叫做星光級的攝影機,價錢會貴到讓你買不下手!

一般水準的感光元件呢?到了夜間當然感受的光度較低,畫面就會暗到讓一般人抱怨了!那要怎麼不花大錢來安撫客戶呢?就是所謂的Auto gain(自動增益)了!將所有偏低的原始感光值都放大幾倍就好了,但是當然連背景雜訊也跟著被放大了!所以那些花色其實只是被過度放大的雜訊,馬路地面當然沒有那麼美麗的花色!不幸的是:我想辨識的車牌也跟著變花了!

還有一個狀況會讓這種模糊變花的狀況雪上加霜,就是毫不考慮地使用JPG壓縮檔!大家只想到讓檔案變小一點,不知道JPG是失真壓縮,失真的部分恰好是讓我們賴以辨識的色差在目標邊界上變得更模糊!如上圖如果是用BMP,PNG或GIF存檔,可能都可以辨識無誤,但是JPG是唯一讓我們辨識變得更困難的壓縮方式!

此時我也想拜大神了!我膜拜的神是人腦的辨識能力!如前面的車牌影像,我想辨識出它們,必須經過將每個字切割出來的過程,在全圖中我必須先知道有幾個「像是」字元大小的目標有湊在一起,我才能將他們視為車牌進行下一步處理。如果它們因為模糊連成一氣?或者變成一堆碎片,每個字元變成一些小碎片?我就只能承認失敗了!但是人腦大神辨識這種車牌卻毫無困難!祂是怎麼作到的?

如上就是我的程式做的二值化切割,高不成低不就,就是無法正確切割出字元。我的辨識核心辨識這種車牌成功率不到一半!不是確定不行,但是要碰運氣!可是偉大的「人腦智慧」就是可以輕易辨識出這種車牌,這就是我至今還兢兢業業認真研究車牌辨識的原因!或許有人會問啦!我這是使用OCR的傳統影像辨識觀念做的,如果是「先進」的類神經網路或許就OK了!

你可以拿Yolo等程式模組試試看!但我不認為會有更好的結果,奉勸AI迷不必抱持太大的希望。原因是那些以類神經網路為基礎的影像辨識是建立在更低階的特徵擷取資料,我是嘗試辨識出一個可以切割完整的目標,它們是辨識更簡單的線段或特定形狀的目標,其實受到這種高頻背景雜訊的干擾程度更大!

事實是:任何影像辨識演算法面對的事實都一樣,能用的影像資訊也都一樣,清晰好辨識的目標其實用任何方法都會有一樣的好結果,面對高雜訊目標時一定必須有額外的設計努力,不會有甚麼演算法天生就可以自動判斷何為雜訊?何為訊號?用機器學習辨識影像的工作者和我的工作絕對一樣沉重。

比較尷尬的是:硬體的進步也很快!之前有好多演算法是努力解決低畫素難以辨識的目標,現在那些努力都沒意義了!現在還有誰在寫程式辨識320X240的影像嗎?如果我現在也投入好多心力處理這種焦距與自動增益造成的模糊與雜訊,不久之後硬體進步了,自動就不會產生這些問題,我的演算法研究就等於白做了!但如果我搶先做到了,在這個空窗時期我就可以用較優質的軟體多賺一些錢了!現實就是這樣的。

不多說了!我要繼續研究為何我的技術跟不上我的大神:「人的智慧」了!我始終相信人的智慧終有一天會變成可以程式化的演算法,我跟AI主流派不同的只是我不覺得目前它們熱衷的研究方向是對的!機率統計絕對不是最有效能針對問題解決問題的萬靈丹!大家不妨繼續看下去!提醒大家,目前還是我這種傳統技術使用者領先哦!機器學習派的影像辨識學者正在我們後面追得很辛苦!好多年了,目前還是差好多。

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=154245470