潛水艇自我定位的慣性導航技術，也可以用到影像辨識上！ - 鄉下老師

字體：小中大

潛水艇自我定位的慣性導航技術，也可以用到影像辨識上！

2023/12/17 09:46:36瀏覽470｜回應0｜推薦8

這個新加坡車牌辨識成功的案例非常有趣，也是一個人眼辨識智慧的精采AI解讀範例！雖然有正常視力(沒有色盲)的人應該都可以正確辨識，但要用程式模擬或「翻譯」出這種影像辨識的智慧其實很難！以我使用的OCR方法來說，受到背景色塊斜切的干擾，大部分字元都會無法正確呈現！此例中只有最前面和最後面的兩個R字可以正確被辨識。

但是以這兩個漂亮辨識成功的R字為基礎，我可以假設字的左或右邊可能有類似形狀大小的字，拿著與R字大小一樣的框架到首字右側作搜索強制切割，很容易就可以找到一個漂亮符合字模的D字！繼續用類似方法一路找下去，就會像順藤摸瓜一般把整串被雜訊干擾，原本無法被正確辨識的字元都辨識出來了！

理論上，只要能假設正確字元的框架大小，進行地毯式搜索，遲早所有這些受干擾的字都能被辨識出來的，CNN的卷積運算(Convolution)就是這麼幹的！但是辨識需要的時間成本太高了！商用辨識軟體不可能這麼設計的！這就是CNN辨識技術至今仍無法被廣泛應用的主因！

這很像在一個大公園裡找被兇手掩埋的屍體，如果可以挖遍整個公園，當然一定找得到，但是成本太高，合理的方式一定是先找到可能埋屍體的蛛絲馬跡，譬如露出地面的衣服一角，或是明顯被挖過的痕跡，從那些極少數的可疑地點著手就可以很快找到埋屍地點！上例中清晰可辨的R字就是Smoking Gun了！

有趣的是我會想到這個方法不是我特別有創意，而是因為我以前的水下科技專業！如潛艇之類潛行或被拖曳在水下的儀器，無法接收GPS訊號，是如何知道自己所在位置的呢？主要是靠慣性導航，從一個已知點下潛後，只要持續偵測自己的前進方向與速度，就可以用向量積分的方式推測自己新的位置在哪裡了！

潛艇在深海航行如何導航？沒有GPS也能高精定位？

當我找到了一個極可能是車牌的字元時，我知道如果真是車牌，左或右方平行位置必定會有大小近似的字，找到下一字後又可以繼續推測一樣距離外會有下一個字，就這樣用「慣性導航」的方式抓出一整串螃蟹了！

好玩吧？所以我常說做影像辨識絕對不能只靠影像本身的資訊！因為人眼人腦做辨識時也不是只靠影像資訊的！太多太多影像之外的常識與科學原理都是我們辨識智慧的成員！如果你以為學會CNN或OCR就可以在影像辨識領域無往不利？你就太天真了！辨識成功的方式可能性太多太曲折了！你必須常識豐富還要很聰明！

( 心情隨筆｜工作職場 )