網路城邦
上一篇 回創作列表 下一篇   字體:
新的一定要比舊的好,不然更新就沒意義了!
2020/04/04 04:21:36瀏覽2432|回應0|推薦10

最近的大工程是導入新的字元辨識方法到我的車牌辨識核心,整體來說我的車牌辨識核心大概分為三部分:首先是簡化影像找到可能是車牌字元的目標,就是一般影像辨識程序中的「前處理」。第二階段是由這些目標的排列組合找出「車牌」,判斷它們的形狀,再扭正車牌,投影到標準車牌的矩形大小。第三階段是在這個已經標準化的車牌影像中一一辨識出字元,這就是目前研究更新的部分!

當然,我的辨識核心主要特色,是第二階段的目標搜尋組合與幾何校正作得不錯,所以可以辨識很多影像已高度變形的車牌。但是當我將高度扭曲變形,有點模糊或較小的車牌抝正為標準車牌大小之後,可以預期字元不會非常清晰正常,簡單的說法就是會變成馬賽克的狀況!幾何校正也可能不會完美,字元會略微傾斜,或偏大偏小,此時還要跟人的判斷一樣正確,就會很有學問了!

總之,字元辨識的方法技術是關鍵的最後一哩路,重要性不亞於第二階段的幾何運算!我之前的舊方法經過幾年的經驗值調整,判斷的能力已經相當有「智慧」了!現在引用我的RD發明的新方法,理論上的合理性與效率都確定較佳,但是對於模糊邊緣的辨識能力是不是可以跟舊核心一樣好?甚至更好?就像NBA新秀狀元也要先跟隊上老經驗的前輩比一比,才能決定誰先發嘛!

我已經依據個案研究調整了一兩周,現在要進入全面的期末考試了!昨天假日加班,先將之前一批近七千張(1280X720畫素)的停車場影像作為考題,分別以新舊辨識核心全部辨識,統計正確與錯誤的張數,以及每張辨識平均使用的時間。這批照片所以適合當考題不是特別清楚,而是相反的,背景複雜還拍得相當不好!這樣才能測試出辨識核心模糊邊緣的辨識能力。

結果舊核心的成績是6422/6970,辨識率92.1%,辨識平均時間170毫秒。新核心的成績是6448/6970,辨識率92.5%,辨識時間123毫秒。辨識正確的能力已經不比舊核心差了!這是讓我最擔心在意的部分,我知道舊核心的能力已經很強,如果新核心不如老將,即使它的速度再快我也不敢用到實際產品中的!辨識正確當然是第一優先的考慮。

其實忙了一整天,我也確實看到幾個需要調整的部分,修正之後才達到這個成績的!證實辨識率無差之後,我終於心滿意足的結束加班,而且也開始興奮,新一代的辨識核心速度會快上很多!123/170=0.7235,快了近三成的時間!這絕對是很大的突破!

雖然原本的辨識速度就不慢了,使用者可能不會感受到明顯差異,但是無形中電腦運算量降低了三成,系統耗能就會大為降低,穩定性會更好!需要追求極速的產品像是車載辨識系統,也可以在更高速之下運作,辨識更多目標了!

這樣我的新版辨識核心就考試完畢?拿到畢業證書了嗎?還沒呢!這只是一個必修科目的考試,我還在等一批請人核對校正標準答案的路邊手拍照片的資料,大約有五千張,那批照片就不像停車場出入口拍的那麼端正了!甚麼距離角度的都有!算是更困難的進階考試,所以新舊核心還要再換場地PK一次!如果新手敗給老將,新版上市時間就還要延遲。

人家說要克敵制勝,快準狠都很重要,對於車牌辨識來說優先次序是:準→快→狠!很高興我目前已經有東西賣了,但是不斷研發進步才能保證我的成功不會只是曇花一現!持續精進研發是我們公司的命脈!也是永遠不會改變的DNA!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:http://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=132356042