人和電腦的能力不太一樣！ - 鄉下老師

字體：小中大

人和電腦的能力不太一樣！

2019/08/13 05:40:12瀏覽1092｜回應0｜推薦14

作車牌辨識軟體就是寫程式去辨識車牌，對我來說，這是一個踏實的科學研究工作，即使頂著AI人工智慧的光環，還是沒有甚麼神祕神奇之處，我不能無中生有，像算命的一樣，沒看到的東西也能用神奇的邏輯做出正確的推測！我們的目標絕對不敢說是超越人的視覺，而是盡量利用電腦的能力，做出合乎人眼判斷的結果而已。好處呢？節省人力，有時候計算的速度略快於人腦而已。

所以很多人來信問我有沒有辦法辨識肇事逃逸的車輛車牌？其實他們不用找我的！如果影像模糊到你都看不清楚，我的軟體也一樣沒用的！如果是對比度的問題，我們可以用影像軟體增強，這些動作稍懂電腦軟體的人都會自己做了，但是如果是解析度不足，那就去找算命的吧！

我現在天天在研究一些較困難辨識的案例，雖然人眼判斷總是比軟體聰明很多，但是電腦與人腦的能力畢竟不同，有時候人眼還是會輸給電腦的！最大的差異就是亮度對比的辨識能力，電腦影像是以RGB三原色各256個亮度等級來製作的，所以如果像上圖位在陰暗區的車牌，人的眼睛要辨識很吃力，但是交給電腦辨識則是非常「清晰」的！下面是用PhotoShop簡單增強對比的結果：

反之，如下圖這樣非常清晰的車牌，我目前版本的軟體卻會辨識失敗！8012辨識成8010，為什麼？因為我的軟體假設車牌字元都是整齊排成一排的！至少字元的上下切線應該是直線的！人看車牌字元時會順勢轉彎，所以毫無困難，但是我要如何讓程式轉彎？這就是有點複雜的幾何問題了！

其實我的軟體相對其他車牌辨識核心來說，已經很聰明了！我可以讓車牌字元區的上下左右邊界各有它的指向斜率，就是任意四邊形的車牌我都能辨識！但是如果是彎曲的邊界就麻煩了！

彎曲車牌可以處理嗎？當然可以！但是這是一個必須考慮代價的研發決策，當演算法複雜了就會有整體穩定性的問題，會不會健康的人吃了不該吃的藥，反而生病了呢？或者，如果你甚麼複雜的狀況都要考慮，那「決策」時間不就會變長？也就是辨識時間變慢了！客戶也會抱怨的！

為了簡化工作，我們當然是盡量將辨識核心做成單一辨識流程的！每一種軟體的車牌辨識核心最好一樣，不然我的工作就會太多了！但是基於實際的需求不同，這些年我的辨識核心還是被迫要做分流，譬如道路版的辨識核心必須一次辨識很多車，還必須很快。反之低速或靜止的辨識就是單張特寫的辨識，是跟道路版不同的！

但是低速單車版本現在也被迫分流了！因為停車場拍的影像控制狀況都很好，如下圖，跟上面這些怪怪影像比簡單多了，甚至拍攝的角度、距離或亮度不好時，還可以要求現場人員調整，所以根本不需要太多模糊辨識能力的考慮，想多了反而會誤事！手拍的照片呢，就千奇百怪，我必須用上所有的辨識邏輯才能有較高辨識率，辨識流程當然必需區隔了！

所以以我的認知，「車牌辨識核心」絕對不會是一個各種情境都通用的辨識流程，如果你是駭客你不會從我這邊偷到一個到處都能用的辨識核心，所以我說車牌辨識應該不單純是一個軟體，它是一種專業的服務！如果你天真的以為買到「頂級」產品就可以隨處適用，你一定會失望的！

( 心情隨筆｜工作職場 )