影像辨識不是甚麼密技，而是來自點點滴滴累積的努力！ - 鄉下老師

字體：小中大

影像辨識不是甚麼密技，而是來自點點滴滴累積的努力！

2023/09/22 04:58:34瀏覽648｜回應0｜推薦2

我日常的影像辨識研究很像資源回收業者，或是專門研究難治疾病的醫生，總是在垃圾堆裡尋找還可以修補使用的廢棄物，或是在絕症病房中找到還能救活的病人！一般影像辨識研究者認為無法辨識的影像，就是我天天工作的對象！譬如車牌本身是清晰的，但從真實世界經過攝影取得的影像呢？甚麼事都會發生！

大多數人都把影像辨識想得太單純了！不過就是找一個SOP把想要的目標辨識出來嘛！這種天真的想法就跟你相信有一種萬靈丹可以治任何疾病一樣的愚蠢！但是機器學習派的概念就是鼓勵大家這麼想，還提供很多方法，如ML、DL或CNN等等，讓大家這麼做！如果真的可以這樣用嘗試錯誤與統計資訊找到萬靈丹，我應該早就失業改行了！

事實是正好相反！ML、DL與CNN等技術在影像辨識領域始終還沒做出過商業化的主流暢銷產品！我這種奠基於傳統影像辨識技術，持續研發精進的業者依舊是市場上的主流與支柱！我們才是真正腳踏實地就事論事對症下藥的正規醫生，不是街上胡亂吹噓販賣萬靈丹的江湖術士！不論是指紋辨識、人臉辨識或車牌辨識都是如此，ML、DL與CNN在影像辨識領域基本上只是插不上手的邊緣技術。

不管你是用哪種技術做影像辨識，多數研究者為了追求表象的高辨識率，總是會自我設限，把辨識困難到一定程度以上的影像直接排除，如上圖應該就是不會列入車牌辨識率計算的刁難影像。但是以一般人視覺判斷的標準來看，應該答案是毫無爭議的AJD-9051，任何有視力有車牌常識的人都不會提出另一個答案！

現在大家都喜歡談AI，但甚麼是AI？甚麼樣的軟體功能才夠格稱為AI？還在眾說紛紜的混亂狀態！最糟糕的一種誤導就是AI=機器學習？在別的應用領域不是我的專長，我不會妄加評論，但很顯然的，在影像辨識領域，機器學習是不適用，甚至不該使用的技術！辨識率低且浪費運算資源效能極差。

以上面的難辨識影像為例，我認為影像辨識中說的AI，應該就是可以至少追上人眼視力聰明程度的軟體！因為影像辨識最大的商業目標與利基就是可以產生「類似」人類視覺的軟體！所以如果面對考試時，我希望這種刁難考題不要出現，但是如果我想做出AI辨識軟體呢？這種難題才是我研究的重點。

我可以很自信的說，在台灣說到辨識困難狀態的車牌影像，我謙稱第二就沒人敢自稱第一的！但是我依舊覺得自己面對AI影像辨識的目標還很遙遠，甚至自覺很渺小！我的車牌辨識核心程式碼已經有九千多行，但距離可以追上人類視覺的聰明度還遠遠不夠。所以我天天都心甘情願的繼續研究！也感謝眾多客戶回饋給我那麼多辨識失敗的困難影像！

我自認最重要的一個影像辨識AI理念是：智慧來自點點滴滴的理解個別狀況，也針對事實原因產生例外處理的對策！譬如上面這張車牌為何難辨識？首先是因為夜間亮度低，導致攝影機的自動對焦功能運作不佳，略為失焦(模糊)，其次是拍攝當時後車的車燈忽然照過來，造成車牌一邊過亮到曝光的程度。

這就很像一個生病的病人，他的身體遭受了跟正常人不一樣的例外壓力，譬如COVID19或登革熱，如果你堅持只用對待正常人的方式，不給予額外的治療，他的病通常是不會自己好的！因為影像本身沒有生命，也沒有免疫系統，它故障了就必須完全靠影像辨識軟體給它對症下藥的修理與治療！

以此例具體來說，就是盡量抓到車牌在全圖中勉強可辨識的跡證，切出大略是車牌的區塊之後，偵測到它一邊亮一邊暗，就設計一個動態的二值化局部程序，左邊當作白天處理，右邊當作晚上對付，最終兩邊的字就比較有機會可以一起呈現出來了！當然這些發現異常後才啟動的例外處理，不應該是主辨識流程的一部份，就像正常人不應該天天吃感冒藥一樣！

所以最終一個合理的AI影像辨識就應該跟人腦一樣的方式運作，面對白天清晰正常的車牌辨識我們只需要用簡單的SOP即可，發現不好辨識時就會因應異常的成因，啟動不同的「影像處理」手段，讓大腦得到更多更好更正確的字元內容訊息，最做出正確的車牌辨識判斷。

我真的就是這麼作的！所以我的辨識核心比較像一個木雕師傅經過很長時間精雕細琢做出來的雕像，而不像依據某種數學模式設計的單一精密儀器！這個雕像還沒完成，所以我天天都有工作要做！

( 心情隨筆｜工作職場 )