網路城邦
上一篇 回創作列表 下一篇  字體:
潛水艇自我定位的慣性導航技術,也可以用到影像辨識上!
2023/12/17 09:46:36瀏覽470|回應0|推薦8

這個新加坡車牌辨識成功的案例非常有趣,也是一個人眼辨識智慧的精采AI解讀範例!雖然有正常視力(沒有色盲)的人應該都可以正確辨識,但要用程式模擬或「翻譯」出這種影像辨識的智慧其實很難!以我使用的OCR方法來說,受到背景色塊斜切的干擾,大部分字元都會無法正確呈現!此例中只有最前面和最後面的兩個R字可以正確被辨識。

但是以這兩個漂亮辨識成功的R字為基礎,我可以假設字的左或右邊可能有類似形狀大小的字,拿著與R字大小一樣的框架到首字右側作搜索強制切割,很容易就可以找到一個漂亮符合字模的D字!繼續用類似方法一路找下去,就會像順藤摸瓜一般把整串被雜訊干擾,原本無法被正確辨識的字元都辨識出來了!

理論上,只要能假設正確字元的框架大小,進行地毯式搜索,遲早所有這些受干擾的字都能被辨識出來的,CNN的卷積運算(Convolution)就是這麼幹的!但是辨識需要的時間成本太高了!商用辨識軟體不可能這麼設計的!這就是CNN辨識技術至今仍無法被廣泛應用的主因!

這很像在一個大公園裡找被兇手掩埋的屍體,如果可以挖遍整個公園,當然一定找得到,但是成本太高,合理的方式一定是先找到可能埋屍體的蛛絲馬跡,譬如露出地面的衣服一角,或是明顯被挖過的痕跡,從那些極少數的可疑地點著手就可以很快找到埋屍地點!上例中清晰可辨的R字就是Smoking Gun了!

有趣的是我會想到這個方法不是我特別有創意,而是因為我以前的水下科技專業!如潛艇之類潛行或被拖曳在水下的儀器,無法接收GPS訊號,是如何知道自己所在位置的呢?主要是靠慣性導航,從一個已知點下潛後,只要持續偵測自己的前進方向與速度,就可以用向量積分的方式推測自己新的位置在哪裡了!

潛艇在深海航行如何導航?沒有GPS也能高精定位?

當我找到了一個極可能是車牌的字元時,我知道如果真是車牌,左或右方平行位置必定會有大小近似的字,找到下一字後又可以繼續推測一樣距離外會有下一個字,就這樣用「慣性導航」的方式抓出一整串螃蟹了!

好玩吧?所以我常說做影像辨識絕對不能只靠影像本身的資訊!因為人眼人腦做辨識時也不是只靠影像資訊的!太多太多影像之外的常識與科學原理都是我們辨識智慧的成員!如果你以為學會CNNOCR就可以在影像辨識領域無往不利?你就太天真了!辨識成功的方式可能性太多太曲折了!你必須常識豐富還要很聰明!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180167081