我的車牌辨識是不是已經提升到認知的程度了？ - 鄉下老師

字體：小中大

我的車牌辨識是不是已經提升到認知的程度了？

2022/10/02 05:26:57瀏覽1346｜回應0｜推薦10

在我來說，影像辨識是一個「認知」的過程！我的工作就是將一般人都會「認為」是合理車牌的資訊用辨識程式盡量提取出來！而且速度要很快，雖然不會比人聰明，但不能比人的辨識更慢！但是大家可能都沒有意識到這是一個多麼複雜的過程？如上這種反光的車牌，如果不是參考到車身等等周邊資訊，我們通常也不會很容易確認的。

要在複雜影像中辨識車牌，絕對是一個「思考」的過程！老實說我做車牌辨識九年了！距離跟人腦一樣聰明的辨識流程，我的程式還差得遠了！我只是像一個聰明一點的幼稚園小朋友，在努力拼湊出自己的辨識邏輯而已！如上的車牌，如果我要像人腦一樣先看環境再找到車牌，這個程式會複雜到我寫不出來！

直接找車牌特徵其實還是我和所有車牌辨識專家共同的方向！但是因為就是會有這些不太清楚的車牌影像，我們還是希望不會錯過，所以我們搜尋可能車牌特徵的門檻就不能太嚴格，候選資料就會很多，計算時間也就會比較久！所以聰明的影像辨識計算量當然比較大，這也是現在的所謂AI影像辨識強調必須用邊緣運算的概念使用大量GPU分散運算的原因！

但是我想他們遇到的問題是：辨識是一個對於整個影像環境「整體」認知的過程！一旦打散運算就不太容易隨時參考很多已經分包出去的運算資料結果，分包出去的計算也很可能不知道某些整體條件已經改變，很多計算工作已經沒必要了！GPU卻還拼命在算？有如戰爭都結束了，兵工廠還拼命加班製造子彈一樣！

我的辨識軟體都是模仿人腦真正思考的方式設計的！很多時候我想模仿聰明人的想法，但是程式演算法想不出來，或程式太複雜無法完成，那怎麼辦？我的策略其實是等而下之模仿比較笨的人的想法！就像比較笨的小孩還看不太懂車輛、馬路、路樹或建築等等東西，要辨識車牌時就是掃描整張影像，直接找像是字元的東西囉！

當然這樣會很耗時，那就要在過程中盡量節省計算資源，譬如已經找到夠好的目標就先試試看走下一個程序，如果走捷徑可以得到合理答案，那就不必找其他模糊的目標之類的！反正就像我們收入有限的一般人，賺的錢是永遠不夠用的！但是能省則省之下大家日子都還過得不錯，如果你不知道這樣調配資源，當然就苦不堪言了！譬如一家人都吃飽了你還拼命叫外送美食就是浪費了！這樣錢當然不夠用！

譬如上面這張約80萬畫素的影像，如果用我的軟體只做最簡單的辨識流程，並不需要878毫秒，只需要268毫秒！如果是我的道路版車牌辨識軟體就會直接接受286毫秒的基本辨識結果，因為車牌模糊，所以答案可能不保證正確？但是即時影像一閃而逝，電腦也還有其他影像要繼續辨識，不可能ㄍㄧㄥ在這邊卡關的！所以就將就使用，結案了吧？

但如果時間不急呢？如上例是事後批次辨識已經拍好的單張手拍照片，我也知道車牌很模糊，我勉強猜的答案未必可靠，所以我會動用多個不同的辨識流程，有如人看不太清楚目標時可能會拿手遮陽光，拿手電筒照遺下，或瞇著眼再看一次等等！最後才將幾次辨識的結果綜合評比考慮，選出最可能正確的答案，需要的時間就變成878毫秒了！

所以當我面對客戶對於單純的辨識率或辨識時間的詢問質疑時，我是很難簡單回答的！我的辨識引擎軟體會跑最慢，但是正確率會最高，原因是軟體會「想」很久，找出最好的答案。車載道路版呢？會盡量搶快，犧牲一些正確率！停車場版就算是折衷版了！

我覺得自己是在踏實與務實地做影像辨識研究，我不知道那些自稱是AI影像辨識的專家有沒有想到我想到的這些事情？他們都跟我一樣面對這些事實與市場需求，但是他們從來不會好好解釋他們的實際做法策略，我真的不知道為什麼？他們總是在讓一般人產生一定會失望的錯誤期待，以為會看到甚麼神蹟？

事出必有因，科學不是神學或玄學，任何AI演算法要有高效率與正確率，最終都是需要知其然，也知其所以然的！只靠資料統計推估的機器學習等等技術可以給我們一個起點，可以協助我們決定哪個方向比較有機會？但終究不會直接產生最佳化的答案！我相信真理越證越明，大家遲早都會相信我的觀點。

( 心情隨筆｜工作職場 )