網路城邦
上一篇 回創作列表 下一篇   字體:
當車牌這麼模糊時,只能希望至少有一人能救全村了!
2026/04/13 03:56:26瀏覽73|回應0|推薦1

做學術研究的人都不喜歡處理實務上尷尬的問題,譬如上面這種過度斜視的車牌,因為解析度不足,字元之間的間隔就是沒有穩定大於一個畫素,字元之間就是不會有穩定的間隔嘛!這是所謂的Truncation Error(截斷誤差),任何影像增強處理技術都救不了的!此時不知民間疾苦的「科學家」就會說那就提高解析度重拍吧?但是那就要花更多錢升級攝影設備了!對於生意人來說,錢就是命啊!

此時我們這種以影像辨識研發「做生意」的廠商,跟大學裡「做學術」的教授想法與做法就很不一樣了!我們一定會想出很多看起來不是很優美,但是可以達到目的的「撇步」,在不提高成本的前提下還是努力將車牌辨識出來!上圖中就是先將車牌的水平傾斜校正好,這是即使字元間有部分是互相沾連時也能做到的!

接下來在已經水平校正的影像上做二值化,就會看到如圖右大部分的字元都是互相沾連的!即使我在此想用CNN的矩陣搜尋方式掃瞄出每個字,我也必須先知道字元的寬度與高度啊!此時就只能找出至少一個可以正確辨識的字元了!只要找到一個確定可靠的字,以它為標準就可以掃描出其他的字了!

所以在此案例中的C字就是一人救了全村的英雄了!只有它是沒有沾連清晰可辨確定是個C字元的目標!如果連一個這種可參考目標都沒有,整個車牌就會無法辨識了!或是必須花費極大的運算資源,如CNN的多次不同大小的地毯式目標搜索,如果這麼玩運算量就會大到必須找GPU來幫忙了!此時攝影機是不必升級了,但是電腦就必須升級,要花的錢就更多了!

我這種在學理上不太美觀的撇步怪招當然要寫成論文是不好看的!但是模糊車牌中至少有一個可靠字元的機率是蠻大的!可以讓這種狀況的車牌大部分變成可以辨識,替客戶省下的錢,以及提高的辨識率效益就很可觀了!我這種做生意的影像辨識專家當然會樂於繼續發明使用這種不正規招式的!

事實上,任何看起來很神奇,也很穩定的影像辨識絕對都是有合理的科學過程的!單純靠大量資料的「學習訓練」,也就是以人眼辨識正確標記答案為基礎累積的經驗值,永遠是不夠好的!一定會時對時錯!因為他們其實沒有分析個案差異的能力!只是統計資料產生的妥協結果,美其名曰「最佳化」?事實上明確善用科學原理解題當然是比最佳化更佳化的最好方式

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=188062895