字體:小 中 大 | |
|
|
2020/01/16 08:45:51瀏覽1734|回應0|推薦9 | |
亞馬遜發展出新的文字辨識技術「TextTubes」,就算文字排列彎彎曲曲也能正確辨識結果 已經有好多人問過我,如果視角較鏡頭拍出來略呈彎曲的車牌我能辨識嗎?我的立即答案都是:不好意思,我目前的辨識核心邏輯還是假設車牌邊是四條「直線」,變形成梯形或平行四邊形都還可以辨識,弧形扭曲太大就不行了!但是你要談我的技術能力作不作得到?答案是肯定的! 雖然我不曾實作出來這種東西,但是如果你知道我目前的辨識邏輯就會知道我一定可以作到!下面這兩張圖是車牌原始影像與我擷取可能的字元目標後的結果: 我是怎麼找到車牌字組的?其實非常直覺,就是跟幼稚園小朋友玩的連連看一樣,將差不多大小成排的目標串接起來,像是那四個圈圈的Audi車的Logo也是可能的組合,但是篩選過程中會加入其他條件檢視,「不像」車牌字源的目標會被一一淘汰。搜尋過程中只是找位置「鄰近」的目標,並不知道車牌字元走向的! 所以如下的香港雙排字的車牌,我也可以組織出來的! 找到字組之後,如果預設他大概就是正面拍攝的,沒有太大水平傾斜或側視,那當然不會成就我可以辨識高角度車牌的辨識核心,我會設法找出字源組的正確邊界,就是如上台灣車牌的四邊綠色切線,再投影轉正成標準車牌寬高的影像: 我說我可以作出彎曲文字辨識的關鍵就在這裡!如果我的「切線」不要假設是直線,而是字與字之間的折線,我就可以算出最接近的弧線,再作正確的弧形轉矩形的校正,彎彎的車牌也可以變成上面這個樣子了!如果這麼「簡單」我為何不直接作進去我的辨識核心裡呢? 第一是因為計算複雜當然會拖慢辨識速度,我是作動態車牌辨識軟體為主的!速度當然越快越好。其次是如果不必要,甚至很罕見的狀況也寫對應的演算法,不僅浪費時間還會造成一些誤認,你就需要花更多時間發讓他們不會與之前的其他演算流程產生矛盾衝突,就是「想太多」反而常常對的都作成錯的! 如果現在有個專案,就是拿魚眼鏡頭拍攝車牌,大部分車牌都拍成弧形的!為了解決問題,而且有合理的費用與研發時間,我就會作出一個針對性的辨識核心,可以順暢的辨識弧形車牌了!不要懷疑,我一定做得出來,但是你會埋單嗎? |
|
( 心情隨筆|工作職場 ) |