只要辨識正確，流程越簡單越好！我的車牌辨識有得來速！ - 鄉下老師

字體：小中大

只要辨識正確，流程越簡單越好！我的車牌辨識有得來速！

2024/04/24 04:57:50瀏覽596｜回應0｜推薦4

圖一、近乎完美的機車車牌影像

車牌辨識是個複雜的AI影像辨識工作，為了提高整體的辨識率，盡量讓各種歪斜模糊的邊緣狀況都能得到正確的辨識結果，主程序必然是個非常精密複雜需要根據科學原理精心設計的機器！而且必須像教育或醫療體系，一定要因材施教或對症下藥的！想要趨近「一個都不能少」的高成功率，老師絕對不可能只用一套教材教法就桃李滿天下，或醫生只用一顆萬靈丹就能治癒百病！

這就是現在以機器學習為核心的AI影像辨識技術對於大眾認知最大的誤導！讓大家以為用很多資料去給電腦「學習」或「訓練」就可以產出面面俱到，甚麼狀況都能辨識正確的聰明軟體？這種事情不可能發生，也從來不曾發生過！就像讓AI作文或創作繪圖還OK，因為只要消極避開明顯不合理的邏輯即可看得過去；但是讓AI根據舊資料自我摸索學習設計一款比現有車款更好的新型電動車呢？那是完全不一樣的事情！所以目前市場上優秀暢銷的車牌辨識核心都「不是」用機器學習做的！這是事實！不服氣歡迎來挑戰！

我認為好的AI不僅要能解決困難的問題，也應該要能適時「偷懶」！就是碰到簡單的狀況也能變通用低成本的方式處理，以節省資源！我的車牌辨識技術在市場上最大的優勢是變形歪斜車牌的辨識能力，如下圖二就是一個案例，重點在於我不假設車牌應該是一個矩形！所以一定會先找到可能的字元目標，加以就近組合排列之後找到車牌字元區的四邊，再用幾何投影的方式轉正車牌子影像，在轉正的車牌影像中才開始辨識目標是甚麼字！

圖二、歪斜的汽車車牌影像

但是如果碰到的是如圖一那樣的非常理想的車牌影像呢？如果你在原圖中不必做任何幾何校正就可以直接辨識出那是個甚麼字呢？如下圖三的狀況，事實上每一個車牌字元都可以直接正確辨識，我們只需要像念書一樣依序「讀出」那幾個英數字就可以完成車牌辨識過程了！還需要動用複雜完整的幾何修正程序嗎？那就像在要求建中學生考數學要先背出九九乘法表一樣，多此一舉！

圖三、依據原圖不需幾何修正就清晰可辨的字元

事實上，對於這種簡單容易辨識的案例，堅持使用複雜的幾何校正過程反而會增加資料處理意外錯誤的風險！有點像學校碰到在家自學已經很厲害的資優生，其實只要經過簡單的檢定考試確認後就該讓他直接跳級了！堅持資優生也必須按照SOP循序讀完所有年級所有課程是很不聰明，也就是很不「AI」的作法！節省資源也是AI的重要目標之一！不是嗎？

我的車牌辨識核心就是一個科學化也人性化的AI機器，我天天都在研究各種狀況的最佳處理方式，以正確辨識為目標，不但要設計出可以解決困難問題的複雜流程方案，碰到不必吃藥打針開刀的輕症病人，我也會給他最簡單有效的處方，讓他們可以快速出院的！辨識越快當然越好用，也越省電！

如圖一左側就是用我比較正常的程序做的結果，所以會切割車牌字元區做出校正的車牌影像，處理時間是123毫秒。如果我發現在原圖中我已經可以很有信心的辨識出每一個車牌字元呢？那就可以像是面對資優生一樣，做些簡單的檢定就讓他快速通關畢業了！少了很多不必要的程序，只需要65毫秒就能得到一樣正確的車牌答案了！

我稱之為我的車牌辨識「得來速」快速通道！換言之，在大多數可以簡單完成辨識的理想狀況時，殺雞不必用牛刀，我的軟體辨識速度就可以非常快！當然也代表可以節能減碳省電環保愛地球啦！但是只要檢定的高標準沒過，譬如車牌字元中有任何一個不夠確定，就會切換到我無堅不摧的主程序了！所以我的辨識軟體內部是有很多岔路車道的！一如大醫院都有分科，用不同的技術流程與設備替各種不同的病人服務。這是機器學習派絕對無法用資料訓練自動達到的精準AI處理架構！

我的辨識軟體為何好？有何缺點？我都會說清楚講明白的！我厭惡說謊，更痛恨詐騙！也希望影像辨識市場不再是AI詐欺的溫床，而是個可以清楚檢驗評比產品效能的地方！我很期待有公平公正公開的官方或民間檢驗影像辨識產品的認證機制，AI詐騙集團真的不要再騙了！好的AI影像辨識絕對不是他們說的那個樣子的！

( 心情隨筆｜工作職場 )