網路城邦
上一篇 回創作列表 下一篇  字體:
帶你參觀我的公司研發的一個角落
2018/09/18 10:49:30瀏覽1523|回應0|推薦9

我的車牌辨識是以找到全景中的字元為主軸的,先找到一顆一顆的字元目標,再像打麻將一樣看看是不是像車牌字元一樣排成一排?這種邏輯程序已經很成功地成為我的車牌辨識產品核心。但這並不是車牌辨識演算法的主流,我認為我的方法很好,比主流派的更好!

但我也知道他山之石可以攻錯,主流派的演算法還是有些特性比我的方法更優秀,可以截長補短,所以最近有點時間就開始深入研究「傳統」的車牌辨識演算法了!所謂的主流派跟我的方法最大差異就是他們不是先找字元,而是先找「車牌」的!我在2013年就模仿實作過這個流程,我也看過很多相關論文,所以對這些程序並不陌生。

他們的辨識起點多半是某種高通濾波,先掃描篩選出圖上亮度對比較明顯的特徵點,通常是用所謂的Sobel Filter,如上圖。因為車牌原本就是設計成讓眼睛好辨識的,當然會亮度對比強烈,這樣一掃描車牌的字元一定會出現在特徵點中,但通常不會很完整得粒粒分明,所以他們接下來會用矩形的區塊遮罩掃描看看,有沒有一些形狀類似車牌的區域有很多特徵點集中。

其實要辨識車牌的重點,不是分析車牌有甚麼特徵?這件事太簡單了!重點應該是:車牌和環境中其他目標有何明確的差異?譬如用Sobel Filter分析後,如上圖的粗糙地面加上正午陽光,地面就是會出現很多高頻的雜訊,如何判斷圖上的兩個紅框,誰「比較像」是車牌呢?人眼當然不會看錯,但是你應該如何用數學描述:為什麼上面那個「比較像」車牌,下面的「比較不像」呢?都有很多特徵點啊?但是分布模式不一樣,請數學公式定量化這個分布型態的差異。

這就是我剛剛交代給RD的一項「工作」,之前研究時好幾次想到要建立這個判斷式,但這不是我的主要演算法所必須,所以沒認真做出來。我很確定一定有現成的數學方法模式可以套用,自己用常識去兜,或查書都可以找到並實作出這種演算法的!所以我會說這只是日常「工作」,而非甚麼了不起的「研究」!作出整個香港車牌辨識核心這種規模與難度,我才會稱之為「研究」!大部分頂大研究所所謂的「研究」,在我這裡都是例行工作而已。

這就是我對於「讀書研究影像辨識」的輕率(輕蔑)態度!如果你的腦袋裡滿腦子都是別人做過的方法論,反而很難保持清晰的常識與直覺,只會一個方法一個方法的套公式,耗時又不能確實掌握識真實狀況,一開始套公式你的理解程度就開始「跳步」了!好像用了一個黑盒子去解決問題,你就開始有一部份程序不知道自己在幹甚麼了!先清楚掌握物理現象與實際需求,再開始去想或找數學方法來準確的解決問題,這才是紮實的科學研究!

所以我常說:要作影像辨識,去讀研究所,學很多影像辨識法,真的不是一個好辦法!除非你的老師本身就是實務經驗很豐富,還很有問題解析能力的高手!不然只會越學越亂,還不如自己在家摸索學得更為踏實。這是真心話!我的公司曾經有位專攻影像辨識的台大電機碩士來上班,他知道的影像辨識方法比我還多,但即使我已經盡力協助,一年之後他還是無法獨立完成任何專案,最終我只能請他離開,可見知識多寡與解決問題的能力真的是完全的兩回事!

( )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=116148078