網路城邦
上一篇 回創作列表 下一篇  字體:
當雨水打壞車牌的時候
2018/12/04 06:19:58瀏覽1224|回應0|推薦7

各位知道當下大雨時車牌看起來是甚麼樣子嗎?「雨滴」在影像中顯示出來的並不是「水滴」,而是如上圖的長直線段。以純粹物理的觀點,雨滴事實上還是水滴狀的,只因為每個影像都是「底片」以一小段時間曝光累積出來的結果。在這一小段曝光期間,因為雨滴下落速度很快,已經跑了一段距離,加上如上圖的環境中車燈很亮,水滴反光很強,就變成亮線狀的影像了!

以影像辨識的角度來說,雨滴就是很多隨機的近似垂直的白色線段雜訊。很像一張油畫,被人用美工刀割出很多裂痕。這樣的影像還能辨識嗎?如果是用一般人的眼睛,加上大腦的「影像處理」,當然是「可以辨識」的!你問誰都知道上圖中的車號是「LB 8555」,但是要用目前水準的「人工智慧」辨識,那就很難了!我也做不到,除非我運氣好,雨線剛好沒割到任何一個字元。

多數的影像辨識專家可能會想從很多數學方法,也就是所謂空間域或頻率域的數位濾波演算法,去嘗試「濾掉」雨滴重現完整的車牌影像。但是如果是我要做,根本不會這麼嘗試,我甚至可以從數學證明他們成功的可能性是趨近於零!

如果是我,一定會放棄任何濾波或強化影像的演算嘗試,直接以物理的觀點,就是雨滴的形狀、顏色與大小等特徵,辨識出所有應該是雨滴的目標,刪掉這些雨滴目標內的顏色與亮度資訊,然後用鄰近的「非雨滴」影像資訊內插補足!這是我發明的嗎?你自己想想:你是不是這樣看出上面車牌號碼的?其實我是「學你」的!

當我們看到上圖時腦袋會怎麼想?第一個想法是:哦,下雨了!那些白線就是雨,我想看車牌應該忽略掉那些白線。此時你的腦袋已經辨識出那些雨線了!但是把那些切過字元的雨線拿掉後,雨線後面應該是甚麼樣子呢?黑色的字被白色的雨線割掉的部分,「我猜」應該也是黑色的吧?補上旁邊的顏色是最合理的,那就補吧!

我的影像辨識哲學就是這樣的!如果只用簡單的數學方法就能達到目的,就直接用,但是這麼簡單的辨識誰都會做,我也不能因此賺到錢!難一點的,其他人都是努力的找出,或拼湊出更複雜的數學方法,來解決問題!但是我不一樣,我總是一開始就嘗試模仿人的辨識思維,先認知雜訊或目標的物理意義與影像特性,根據這些資訊來設計我的辨識流程。

我目前還無法辨識被雨線破壞的車牌,卡關的是我還無法很準確的辨識雨線目標,如果可以!加上鄰近內插補洞的機制,我就可以跟人一樣聰明的辨識出雨中的車牌了!我的研究是不會落空的,因為人人都可以辨識圖中的雨線,必然有共通的邏輯,只是我還沒整理清楚而已。

對我來說,影像辨識即使是我還沒做過的,我都覺得慢慢琢磨一定可以做出來。因為我知道已經「有人做過」了!就是千千萬萬人的眼睛與大腦,既然「大家」都會做,我只是嘗試把大家腦中的想法與作法用程式寫出來,怎麼可能會毫無頭緒?怎麼可能會遙不可及?所以我說:我確確實實是在研究「人工智慧」,「機器學習」就根本不是!

他們研究的是「機器」智慧,不是「」的智慧。他們的「研究成果」是基於一堆已知答案的資料,做出最高正確率的反應,很像訓練人的反射動作,但是為何要如此反應?他們不在意,也不知道!所以遇到新的狀況就完全不知所措,很可能做出不合理的反應。正確的人工智慧應該是根據「原因」做出回應,而不只是根據「經驗」做出回應。合理的「智慧」是如果知道原因應該根據原因反應,實在不知道原因時才根據近似的經驗「試試看」。這就是機器學習在人工智慧研究領域應有的地位,他們是備案!

( 知識學習科學百科 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=120835309