網路城邦
上一篇 回創作列表 下一篇   字體:
如何辨識反光的車牌?我告訴你!
2024/03/29 09:07:17瀏覽767|回應0|推薦9

這種因為反光很難辨識的車牌其實蠻常見的!多數人以為只要車牌本身光鮮亮麗,加上晴朗的好天氣車牌就一定很好辨識?但事實上就是因為陽光太強,車牌也太乾淨光滑,在好天氣的中午時分最容易出現這種讓辨識軟體尷尬的影像!因為這難不倒一般人的眼睛,用力點看還是可以辨識的,如果辨識軟體一碰到反光就投降,就會被批評「不夠AI」了!這是我們這個行業最大的壓力!

我是專治車牌辨識疑難雜症的醫師!即使多數客戶可以接受這種車牌無法辨識,我都始終耿耿於懷,這些年一直都在思考研究如何解這題的方法?而且我比那些自稱AI的影像辨識專家自我要求更高!我不會提出一種解法讓運算量大增,逼客戶去買超貴的電腦才能跑,辨識速度與設備需求必須還是與之前版本差不多才會推出!低薪通膨之下大家都沒錢買AI專用電腦的!

而且我不學那些AI專家搞神秘!既然有了合乎科學原理的解法,就會像一般老師一樣,用誰都聽得懂的方式告訴大家,歡迎陪著我一起腦洞大開模仿創新,這樣科學才會進步,也讓大家對我的技術有合理的預期與信任!須知任何藥方當然都是有極限的!不是貼上AI的標籤,蒙上AI的神秘面紗所有問題就都解決了?凡是說不清楚或不肯說清楚的演算法都是可疑不可靠的

這種反光車牌的物理特徵是甚麼?為什麼一般人可以同時辨識反光與非反光的字元?看看下面的二值化圖就知道了!即使是反光的字元,畢竟顏色還是與車牌的底色有相當的落差,我們如果取一個較簡單的單一亮度門檻來分黑白,反光字也不會完全看不到,而是看起來變成只有斷續輪廓的空心字!這就要感謝我們的車牌其實是有一點字元突出類似浮雕的設計了!人眼也是依靠這些細微特徵辨識目標的!

所以像上圖我們還是可以做到車牌概略定位的!找到車牌之後如果可以更精準的調整小區域內的二值化門檻,其實是可以讓所有字元都看得相當清楚的!如果用PhotoShop軟體作臨界值的實驗。臨界值太高黑區變太大,字元就會連在一起無法分辨,太低就會讓反光字更破碎甚至消失。但足以分辨出每一個字元的臨界值範圍還是蠻大的!如下就是一個足以分辨所有字的合理臨界值:

這就是反光字元車牌的物理事實狀況了!我用影像軟體快速檢視我想知道的物理(影像)事實之後,我就知道可以同時分辨所有字的單一二值化門檻是存在的!我就可以開始建構我的數學公式找到車牌區域的理想門檻值,然後寫成程式就變成我的軟體成員了!我的研發鮮少失敗,原因就是我絕對不會去做不可能的事情!如果PS告訴我單一門檻怎麼作都不會對,當然就要想別的方向了!

事實上我不必寫太複雜的計算門檻程式,直接「掃描」幾個不同的門檻值看看能否辨識出所有字元即可!辨識不完整就試下一個,幾個範圍內的門檻都做一次,擇優錄取的意思!其實目前他們吹噓的AI也都是這樣以嘗試錯誤為基礎的!但是如果你能用越多聰明的科學(物理)原理將可能的計算目標範圍直接縮小,運算量就會大減,也就不必太依賴輝達的AI晶片也能做好很多事了!

我不會否定現在輝達等公司推出高運量設備的價值!各種AI應用的計算量一定是越來越多的!但是在這個大趨勢之下,我們軟體人能做的事是「減少」運算量,一樣的AI目標如果可以用較少的運算量達成就是替客戶降低成本了!就像幾千萬的超跑當然比我家的Honda功能更好!但以一般代步需求來說,幾十萬的Honda就夠好了!買平價車的人還遠多於買超跑的,所以我的研發絕對是有商業價值的努力!

以學理的角度來看,我也算是有受到那些AI技術CNN的啟發了!他們面對所有的問題都是先想如何用大量計算掃描圖形特徵!我知道那樣做成本很高,所以能用其他方法就會避開凡事先掃描嘗試錯誤的思維!但是如果我已經很接近答案時,只做兩三個嘗試錯誤當然沒關係!我也會學他們的「AI」模式的!就像高爾夫選手,最後一桿距洞口只有十公分時就不會正經八百的雙手持桿瞄準半天了!可能就單手持桿隨便碰一下讓球進洞就收工了!

而且我的掃描概念不是只有用在空間域,就是全圖地毯式的移動掃特徵之類的。如這個例子,我的掃描嘗試錯誤是用於較抽象的門檻值設定,他們可能會說是嘗試改變分類原則,美其名曰「深度」學習了!反正這些名詞是隨便他們定義的,不管怎麼學習,其實都是嘗試錯誤湊答案而已!真正知道自己或別人在做甚麼事情才重要!不要被AI迷藥搞糊塗輕易被騙就好了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180448074