網路城邦
上一篇 回創作列表 下一篇  字體:
碰運氣賽到的不算辨識成功!
2019/10/09 06:55:13瀏覽811|回應0|推薦3

昨天客戶回執這張影像,之前版本會辨識錯誤成:R8-8486,為什麼會有這麼離譜的錯誤?起因都是最左邊的5字與背景沾連了!局部放大二值化影像會是這樣的:R字剛好可以被切開辨識為獨立目標(但也很驚險),5卻跟背景沾到相連了!我不知道它是一個獨立的目標當然就沒法將它辨識成一個字了!

如果這種小意外就會讓我束手無策,我也不可能混到今天了!我的作法可以直接告訴你!不怕大家學習模仿,如果你有更好的點子願意指教我更高興!先看我的原始目標辨識結果會是如下圖這樣的:

黑框字是原圖中的R8848,我從台灣車牌規則知道應該沒有R8848這種白底黑字的車牌,所以會嘗試往左右方找找看是不是有「很像字元」的東西?即使他們不是「獨立目標」也會依據已經辨識成功字的大小去挖一塊下來!但是我並不確定應該挖左邊或右邊?所以會有一些評估運算決定挖誰?甚至可能兩邊都「試試看」,算出兩組答案,再從其他條件看看哪個答案比較像是對的?甚至到最後關頭還會檢視格式,有必要時再直接刪除或更改一個字元都可能的!

總之,我的單張辨識核心內部的流程就有如都會區的街道巷弄般相當複雜,但同時也是很有條理的!我隨時可以追蹤每一個案例的辨識流程作分析檢討。很多人會說我的辨識軟體「很聰明」,聰明的腦袋不可能太簡單的!當然這些規則一開始設計時是有點靠想像力的,正如立法院立法一樣,常常實際執行時才會發現某些條文窒礙難行,甚至產生負作用。沒關係的!知錯能改就好了!

上面這個案例就是缺的字其實是左邊的5,我的舊版程式卻判斷應該在右邊,所以硬湊出一個「R8-8486」這樣的怪答案!這也不能怪它太笨,右邊區塊的影像真的有一些像字的特徵嘛!這個階段我還沒辨識個別的目標是甚麼字?所以不知道它們其實是來亂的小數字。

當然認真找一下,想一下,一定可以找出應該挖左邊而非右邊的理由加入程式,也就是在二值化圖的階段如何辨識「應該是車牌字元」的邏輯!改好了以後就不會再因為這種狀況而有這種誤判了!其實我昨天一開始有點趕工,隨便改了一個程序,並不是上述的這個判斷式,但剛好也讓這個案例辨識成功了!

這就是說我的其他程序意外修復了這個辨識結果,但是我發現辨識過程很迂迴很奇怪,深入分析才知道問題的關鍵點。所謂碰運氣賽到的正確結果其實都是不穩定的!譬如我的第一修正版,在該影像稍微放大時反而會辨識錯誤?這就不合理了!所以即使答案對了,我的程式也非修改成穩定版不可!因為下次運氣不見得那麼好,這不是賭博,不能靠運氣的!

其實我會發現這個問題是因為我依據產品不同有好幾個主辨識流程,包括:停車場版(寧缺勿濫)、道路多車版(大小通吃,夠快就好)、手拍單張辨識版(終極辨識能力)與工程車專用版(綠牌與骯髒車牌辨識率最佳化)等四個流程。理論上單張辨識版是最完整的辨識流程,就是不計時間成本,盡量辨識到對的終極版,結果我第一修正版的停車場辨識流程得到正確答案5R-8848,終極辨識版的答案卻是錯的?

所以才會讓我深入分析追蹤詳細過程,最終發現也解決了真正的問題。我認為人工智慧就應該是這麼作的!逐步建立針對特定類型影像目標的,精確且可以掌控分析的演算法!這樣作的軟體才真的會「越來越聰明」。其實跟人一樣,只靠經驗不知而行的是工匠,有經驗而且可以分析解釋其中邏輯的,我們稱之為科學家或師傅!我確定自己是影像辨識領域的科學家,僅依賴機器學習做辨識的那些人顯然不是

我常常在此闡述機器學習(包含深度學習)的價值在影像辨識領域中被過度高估了,而我用的傳統演算法研究則被嚴重忽視了!其實一般的影像辨識軟體的使用者根本不必理解或在意這種學術論戰的內容或結果!他們只要知道以下的事情就好:

機器學習派產生的軟體,無法精確告訴你一個案例是如何辨識成功的過程與原理,當然也無法分析任何一個錯的案例是如何錯的?所以當客戶提出錯誤案例希望更正時,他們無法直接修正程式更新軟體作為因應!只能加入錯誤案例讓電腦重頭面對巨量資料再學習一次!你就有得等了!還要多花好多錢。如果還是無法辨識,你問他們怎麼回事,他們只能兩手一攤說不知道!因為是電腦自己設計的程式,不是工程師。

但是我的軟體出現錯誤案例時,你只要給我辨識錯的影像,十分鐘之內就可以追蹤到錯誤的關鍵,如果不須新增演算法只調整參數,半小時內就可以更新軟體給你!而且不必收費,我還會感謝你讓我的軟體變聰明了!即使必須想個新的演算程序因應那個錯誤,設計與調整測試的時間也不會超過兩天。真的無法解決時,我也可以給你詳細的報告說明,你就可以在拍攝端知道該怎麼作,避免這種狀況了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=129928534