我可以告訴你找到每一個車牌的完整故事，機器學習行嗎？ - 鄉下老師

字體：小中大

我可以告訴你找到每一個車牌的完整故事，機器學習行嗎？

2020/05/03 08:51:47瀏覽3491｜回應0｜推薦4

進入百萬畫素的時代後，車牌辨識其實已經變成一種全新的技術，在此之前，做車牌辨識時使用的影像，車牌是絕對明顯的主角，所以「車牌在哪裡？」不是個太困難的問題，雖然有「搜尋鎖定」車牌位置的演算法，但是相對於現在要從百萬畫素的全景影像中找到車牌需要的演算法來說，都簡陋到不堪使用了！

如果連車牌的位置都找不到，當然就不必提你的字元辨識能力有多好多準確了！為了找到車牌，為了節省運算時間，為了能找到不是很正的車牌，這幾年其實是全世界的車牌辨識核心都需要被打掉重做的年代！危機就是轉機，我就是看到這個全球性的車牌辨識災難，才敢大膽跨入這個領域的！因為我有機會跟全球的研發競爭者一起重新起跑，勝負未知，但我有公平競爭的機會。

這個過程中，因為影像辨識需要的演算法難度驟然提高了太多，很多人失去了逐步研究事實現象的耐心，或許老闆與民眾們也施壓太大了吧？所以出現了很多「速食」選項，就是所謂的「機器學習」！大家開始想跳過事實研究的階段，直接找到仙藥！希望有一些演算法可以鎖定任何想找的目標，他們稱呼這種神奇的東西是「人工智慧」？

事實上這當然是對於人工智慧一詞的誤解，也是不切實際的幻想！但是有需求就會有詐騙，就會有很多心術不正想騙到資金，或真的自以為可以修煉成仙的半調子科學家投入這種虛妄的研發。這種研發總是充滿希望，卻罕見可以真的依賴機器學習產出可靠的高辨識率產品。我的看法是不必多久後，主流的影像辨識還是會回歸到依據事實現象研究適切演算法的型態，機器學習終究只能回到統計推算資料趨勢的領域，因為它們無法真的自行產生智慧。

舉個例子吧，一般車牌辨識系統的介紹中，鎖定車牌這部分都是輕輕帶過，好像很簡單的樣子？如果整個辨識流程圖有十個方塊，它們最多只佔兩個方塊，但其實它們是最難也最重要的部分，因為真實環境中太多不確定的雜訊了！常常車牌字元還不是對比最好最明顯的目標，要很快而且正確的找到它們我到現在還不斷的在研究。

這張照片看起來辨識車牌不難吧？但是我不敢先捨棄所有可能性，還是乖乖的作好全圖的灰階、二值化並取得輪廓線，準備依據輪廓的封閉曲線找到可能是字元的任何目標。

接下來就是篩選封閉曲線的大小形狀，排除不可能的目標，變成這樣：

影像處理到這個程度已經不難找到構成車牌的幾個字元組合了！但是這幾年一直讓我覺得蠻困擾的是如上圖的地面，或很多時候會出現在背景的樹叢草叢，它們在豔陽下都會產生很強烈對比的不規則雜訊，其中總是有很多會通過形狀大小的篩選，如上圖一樣，我必須真的讓它們參與找車牌的程序，浪費很多不必要的處理時間，即使我們人的智慧說：根本不必裡它們啊？

重點是：在數學上我怎麼決定可以明確排除它們，知道它們不可能是字元？方法總是會有的！人的腦袋就知道，只是我們該如何將這種一般人都有的認知數學化而已！要找到方法，當然必須研究實際的辨識過程，仔細而且數位化的研究何者可以直接確定是雜訊？昨天算是有了一個突破，發明了一個演算法可以將剩餘目標變成這麼少！

事實上我知道這個問題好幾年了！始終找不到很好的邏輯，這幾天在作工程車，因為多半是負片辨識，原本就會比正片辨識慢，加上那批照片背後是樹叢，大概是這個樣子：

就是因為那些莫須有的樹叢目標們，不但存在還常常比綠色的車牌字元還要綠而且亮，所以這些辨識就顯得特別慢，一定要花好多時間嘗試將樹叢雜訊組織車牌都沒結果之後，才會輪到真正的車牌字元。現在依據目標特性直接篩選掉就會讓辨識速度加快許多！

簡單說，我的每一次找車牌的故事細節我都可以分析研究，知道它們為何成功？為何失敗？為何速度較快或慢？所以我可以不斷精準的研究精進，讓我的辨識核心更聰明更廣用，失誤犯錯的機率越來越少！速度也越來越快，其實跟人的智慧增長是一樣的，少作傻事就變聰明了！這種研究才有資格叫做「人工智慧」吧？

機器學習派的玩家，你們可以說出任何一次你的辨識的詳細過程、故事、原因以及你為何讓它如此發生嗎？你能操控你自己的研究，讓它們越來越合理越準確嗎？你們只是在抓瞎嘗試錯誤想買到樂透中獎吧？那就祝你們好運了！但是我可以斷言，即使你中了獎，也不知道發生了甚麼事情？這樣當科學家挺心虛的吧？我是不會這麼作的！

( 心情隨筆｜工作職場 )