網路城邦
上一篇 回創作列表 下一篇  字體:
東南亞車牌知多少?
2023/11/29 10:25:18瀏覽558|回應0|推薦8

雖然各國車牌都是以英數字為主,但是字型、字數、格式、顏色,乃至單雙排的配置方式,地域性的差異是非常大的!而且任何單一國家內的車牌形式也很多樣化,即使監理單位有公告字型格式,但各國車牌多半都不是政府統一製作的,未必都會嚴守規定,人眼看那些英數字是沒問題,但你如果只按照公告規則寫軟體,例外一定很多,辨識率不會好到能賣的!

大家玩過網路上的OCR嗎?可以把充滿文字的圖片真的辨識成文字檔案,那種軟體很貴的!比車牌辨識軟體還貴很多!因為它們必須能看懂幾十種(甚至上百種)字體的同一個字,背後的字型資料庫是非常龐大的!即使車牌製作的廠商不太守規矩,我們也只需要增加某些字的兩三種特殊變形,車牌辨識的字模資料庫最多不會超過百字!資料量小到可以直接寫進程式碼內部的!

因為深知車牌的地域性差異,每次當我聽說某些車牌辨識品牌可以辨識多國車牌時,都是很懷疑的!幾十個國家的車牌都能辨識到98%?不太可能吧?我自己研發台灣車牌辨識到第三年才有了市場競爭力,也是那時開始我就已經無懼於國外品牌的挑戰了!除非他們也跟我一起蹲在台灣研究各種例外與地域性差異很多年,但連大陸廠商都不會這麼作的,因為台灣市場沒這麼大嘛!所以大家完全不必懷疑,我(本土)的車牌辨識率一定可以完勝國外品牌的!不管他們的品牌有多大都一樣的!

但是如果我用這十年研究台灣車牌期間建立的有系統的技術架構與經驗,加上有足夠的目的國資料來源,就是來自當地的車牌照片或影片,我要在家研發做到可以推出某國商業等級的車牌辨識軟體呢?應該不必很久的!這些年我們也三不五時嘗試做其他國的車牌辨識,只是還沒有適當的管道真的賣到國外而已!最近又有雄心勃勃前進東南亞的廠商來詢問,希望這次可以成功!

事實上拜網路方便之賜,即使完全沒有可以直達目的國的廠商協助,要做出外國車牌辨識的雛型也很容易的!只要Google該國車牌的圖片就會有好多資料可用了!但是這種搜尋條件是很鬆散的,裡面會夾雜很多不是該國的車牌,所以你必須先做功課閱讀一些該國車牌的格式規定,最常用的就是維基百科了!

如果你想找到更多圖片做研究,有個小技巧是用當地語言的「車牌」這個詞來Google,譬如用Nombor Plat Kenderaan Malaysia就可以找到多出一倍以上的馬來西亞車牌照片!我的協力廠商是答應會幫我在當地拍攝影片資料,也已經送來了幾段數分鐘的印尼街景影片,在後續資料到達之前,我就是這樣開始做多國研究的!目前印尼、新加坡與馬來西亞三國的網路圖片我都大致能辨識了!越南車牌也已經收集好了數十張資料準備中。

基本上這幾個國家的車牌相似度頗高,跟台灣有點像的是英數字會自成段落,不是英-數兩段式(馬來西亞),就是英--英三段式(印尼與新加坡)。跟台灣最大的不同是每個段落的字數是很自由的!每段可以簡單到只有一個字!也可以多到四個字。所以如下的V-1SBW-6120-C都是可能出現的合法車牌。

完全可以預期的是:他們的車牌字型非常混亂,同樣63就可以至少有三種差異很大的字型,人眼看沒甚麼問題,但是要做字模比對時,筆畫位置差異之大就可以讓辨識完全失敗了!必須製作好多個字模來應對,更不必說還有B8Q0DG6WMN之類近似字型的交叉誤認了!那種混亂的程度是比台灣車牌更恐怖的!還好我有豐富的台灣經驗,現有的這些網路圖片幾乎都不會認錯了!

目前碰到最經典刁難的車牌是如下圖的新加坡研究用車牌,標準的OCR辨識程序都是用「二」值化的方式切割出字元與背景,碰到有兩種明顯不同顏色的背景,正常做出來的二值化圖上,背景本身就是最大的干擾雜訊了!有點像測驗是否色盲的那種圖片!好像是故意出來刁難辨識技術的考題?但我還是發明了一個新的演算法克服了。

研發新的東西很好玩的!即使我知道這種國外推廣的生意未必會成功,也不是操之在我,我沒那個野心與資本變成國際廠商的!只是配合其他公司的計畫開發核心技術而已,我做到100芬也未必賣得出去!之前已經有多次長治失敗了,我也沒賺到錢,但有賺到一些資料與經驗,這次合作廠商投入更大!據說已經到新加坡設分公司了!希望可以開花結果。

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180111269