車牌辨識的決勝戰場在幾何校正！AI面對了嗎？請踹共！ - 鄉下老師

字體：小中大

車牌辨識的決勝戰場在幾何校正！AI面對了嗎？請踹共！

2022/09/24 04:14:45瀏覽1757｜回應0｜推薦12

在3D世界的自然環境中拍照車牌，如上的各種角度的連續變形是必然的現象！要正確辨識目標是甚麼字？合理的方向當然是要設法將變形的目標轉(扭)正，在影像辨識的術語中，這種處理過程叫做正規化(Normalization)。

如果是用掃描方式取得的一般文件2D影像，正規化的過程只需要做：平移、旋轉與縮放三種比較簡單的幾何演算法操作，就可以將目標轉正，但是在立體空間直接拍照的結果呢？車牌就可以變成任意四邊形！你必須有更複雜、聰明且很有彈性的幾何演算法的處理能力！

所以我們現在接影像辨識專案時一定會很注意這個差別！掃描影像(2D)與手拍影像(3D)辨識一樣的目標，我們的報價與開發時間通常是兩三倍！之前替翰林出版社開發的手機閱卷辨識核心就是沒注意到這個差異，結果虧大了！包含完整技術轉移的收費也才二十多萬！本以為一兩個月可以搞定，一作就是大半年！比去小七打工還難賺？但為了商譽我們還是硬著頭皮做完了！他們可是得意得很！

回到3D環境目標辨識的問題，很顯然的：找到目標區，如最上圖的紅色矩形框，只是一個必要的起點，真正要正確辨識出可以用的車牌資訊，只到這個步驟連半路都還不算！但是好多AI影像辨識的視訊就喜歡誇張地展示他們可以在複雜街景中找到車牌的技術，用很多矩形框框動態地畫給你看！這就像幼稚園小朋友炫耀我會拍球了一樣，好蠢的感覺！因為那是最簡單的起步而已！

而且他們展示的一定不是像我的上圖這種高度歪斜的車牌！我是故意搞怪嗎？當然不是！這些照片都是路邊停車收費開單的工作人員「很認真盡職」拍出來的！因為此車前面還有其他停車，們他是無法跑到車前拍出好辨識的影像的！這麼斜的車牌是常態不是例外，我們想研發銷售車牌辨識的人能規避這種問題嗎？

所以我把我的辨識玩到那麼「變態」？並不是我愛耍酷玩特技，這是我這一行必須走的一條路！如果環境可以讓我取得較好辨識的影像，我當然會要求客戶不要讓辨識變得如此困難，如停車場的攝影機就會設在最佳的角度。但是也因為停車場的車牌很好辨識，大家都會作，我的鄉下小公司廣告不夠大，反而搶不到生意了！

所以我這幾年雖然自己號稱，也被業界認定車牌辨技術非常好！但是簡單的車牌辨識市場我都沒有甚麼商機！我賺的錢都是類似上圖這樣很難辨識的小眾市場，除了路邊開單員手拍的斜角照片之外，車載的系統也是斜拍辨識路邊停車的！在這種困難的小市場上，我在台灣還看不到甚麼競爭對手！還勉強夠生活養家啦！

基於防止AI詐騙的社會責任！我想提醒大家的是：任意角度的目標變形是無法經過機器學習的過程「訓練」到高辨識率的！0-90度的字形狀都不一樣，斜視是0-90度，傾斜也是0-90度，兩個變數相乘的可能性是無限多種！你需要蒐集(或製作)多少變形車牌影像資料才夠機器學習之用呢？那需要多少錢？多少時間呢？

你花得起這麼多錢嗎？你有這麼多時間嗎？別傻了！用幾何學處理變形車牌的校正是唯一的途徑，沒有任何其他可行的捷徑！如果有AI專家不同意我的說法，就請站出來踹共！做個跟我的軟體斜角辨識率一樣或更強的AI軟體來PK！跟大眾證明我是個危言聳聽的反AI環保恐怖份子！不然各位ML與CNN專家們就請乖乖聽我講道了！我不會評論我做不到的事情，下面就是我的實驗實例！如有不實作假我就退出江湖！

( 心情隨筆｜工作職場 )