網路城邦
上一篇 回創作列表 下一篇  字體:
人和電腦的能力不太一樣!
2019/08/13 05:40:12瀏覽1092|回應0|推薦14

作車牌辨識軟體就是寫程式去辨識車牌,對我來說,這是一個踏實的科學研究工作,即使頂著AI人工智慧的光環,還是沒有甚麼神祕神奇之處,我不能無中生有,像算命的一樣,沒看到的東西也能用神奇的邏輯做出正確的推測!我們的目標絕對不敢說是超越人的視覺,而是盡量利用電腦的能力,做出合乎人眼判斷的結果而已。好處呢?節省人力,有時候計算的速度略快於人腦而已。

所以很多人來信問我有沒有辦法辨識肇事逃逸的車輛車牌?其實他們不用找我的!如果影像模糊到你都看不清楚,我的軟體也一樣沒用的!如果是對比度的問題,我們可以用影像軟體增強,這些動作稍懂電腦軟體的人都會自己做了,但是如果是解析度不足,那就去找算命的吧!

我現在天天在研究一些較困難辨識的案例,雖然人眼判斷總是比軟體聰明很多,但是電腦與人腦的能力畢竟不同,有時候人眼還是會輸給電腦的!最大的差異就是亮度對比的辨識能力,電腦影像是以RGB三原色各256個亮度等級來製作的,所以如果像上圖位在陰暗區的車牌,人的眼睛要辨識很吃力,但是交給電腦辨識則是非常「清晰」的!下面是用PhotoShop簡單增強對比的結果:

反之,如下圖這樣非常清晰的車牌,我目前版本的軟體卻會辨識失敗!8012辨識成8010,為什麼?因為我的軟體假設車牌字元都是整齊排成一排的!至少字元的上下切線應該是直線的!人看車牌字元時會順勢轉彎,所以毫無困難,但是我要如何讓程式轉彎?這就是有點複雜的幾何問題了!

其實我的軟體相對其他車牌辨識核心來說,已經很聰明了!我可以讓車牌字元區的上下左右邊界各有它的指向斜率,就是任意四邊形的車牌我都能辨識!但是如果是彎曲的邊界就麻煩了!

彎曲車牌可以處理嗎?當然可以!但是這是一個必須考慮代價的研發決策,當演算法複雜了就會有整體穩定性的問題,會不會健康的人吃了不該吃的藥,反而生病了呢?或者,如果你甚麼複雜的狀況都要考慮,那「決策」時間不就會變長?也就是辨識時間變慢了!客戶也會抱怨的!

為了簡化工作,我們當然是盡量將辨識核心做成單一辨識流程的!每一種軟體的車牌辨識核心最好一樣,不然我的工作就會太多了!但是基於實際的需求不同,這些年我的辨識核心還是被迫要做分流,譬如道路版的辨識核心必須一次辨識很多車,還必須很快。反之低速或靜止的辨識就是單張特寫的辨識,是跟道路版不同的!

但是低速單車版本現在也被迫分流了!因為停車場拍的影像控制狀況都很好,如下圖,跟上面這些怪怪影像比簡單多了,甚至拍攝的角度、距離或亮度不好時,還可以要求現場人員調整,所以根本不需要太多模糊辨識能力的考慮,想多了反而會誤事!手拍的照片呢,就千奇百怪,我必須用上所有的辨識邏輯才能有較高辨識率,辨識流程當然必需區隔了!

所以以我的認知,「車牌辨識核心」絕對不會是一個各種情境都通用的辨識流程,如果你是駭客你不會從我這邊偷到一個到處都能用的辨識核心,所以我說車牌辨識應該不單純是一個軟體,它是一種專業的服務!如果你天真的以為買到「頂級」產品就可以隨處適用,你一定會失望的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=128497779