網路城邦
上一篇 回創作列表 下一篇  字體:
要做好AI,推理能力比機器學習重要
2020/12/04 07:26:24瀏覽892|回應0|推薦8

不必懷疑,我的標準辨識核心真的可以成功抓到且正確辨識這個車牌!事實上多數車牌辨識系統可能要鎖定(找到)這個車牌都很難,即使找到了,因為車牌上的小燈太亮,過度曝光造成字元不完整,要得到正確車號還是非常困難。這和昨天文章中說的隨機雜訊造成的問題不一樣!這不必靠運氣,祈禱某個隨機雜訊不要剛好跑到關鍵位置來搗蛋,而是要正確理解雜訊的成因,使用針對性設計的演算法得到正確的答案!

通常容易辨識的清晰車牌大家照著課本做,譬如我剛出版的那本書,就可以辨識成功,所謂商業等級或專業水準的辨識,就是要能挑戰這種困難的辨識,以期盡量接近人眼的辨識能力。所以那些堅稱自己的車牌辨識率是多少趴的人還真敢講?我就很不願意正面回答這個問題!如果考題都像上面的這麼難,你的辨識率還是99%嗎?騙肖欸!

一般的車牌辨識工程驗收都會加註「以人眼可辨識」的車牌作為辨識率計算的分母,如上的模糊車牌通常是不算的。但這不是一個明確的標準,如果遇到刁難的評審,此案例以人的智慧,即使字元並不完整,只要用一點想像力,還是每一個人都會「猜對」這題的!評審如果堅持這種品質是「可辨識」,還要達到九成以上,那廠商都別玩了!這就是我每天在研究嘗試挑戰的模糊地帶了!希望有一天沒有任何評審可以刁難到我!我已經走很遠了,但前面的路還是很漫長,這就是一個AI研究的現場實況了!

現在多數從事AI研究的人通常是這麼辦事的:已知有明確可用的方法能解決的問題,當然直接照書寫程式處理掉!書上還沒提到,也還無法精確處理的問題呢?就毫不考慮開始收集資料讓「機器」去「學習」了!人呢?就可以到旁邊滑手機去了!如果這樣真的每次都有用,那大學也不必設那麼多系,至少所有研究所都不必開了,因為有資料就會有答案,不需要科學家了!

事實是機器學習不會自我調整很快得到理想的算法與結果,會讓認真使用機器學習的開發者陷入機率統計的數學深淵,他們依舊必須時時回頭研究物理事實,否則光是玩數學就會陷入迷宮永遠走不出來!要達到跟我一樣的研究目標,他們付出的心力會比我還多上不只一倍!機器學習絕對不是省時省力的工具!千萬別以為既然是機器在學習了,我就不必學習了!這個浪漫幻想至少我們此生都一定看不到!

像上面這個案例,困難點第一是車牌本身的亮度就不均勻,傳統上以「找車牌」為基礎的演算法執行就很困難,以低階影像特徵為基礎的新型CNN等演算法比較穩定,像是線段、轉角與小方塊等原始特徵資料總是可以找到的。但是如何依據一堆碎片組織出合理的車牌位置?事實上會比我用OCR方式(辨識可能的字元目標)困難一些,或者說需要嘗試錯誤找出正確組合的次數會多很多!所以效率必然是比較差的!大家不必有太浪漫的遐想。

上面是我的二值化圖當背景,從裡面篩選出可能的車牌字元,正規化之後的車牌灰階與二值化圖會變成這樣:

其實從車牌灰階影像到二值化就有好多輔助程序,否則直接用PhotoShop的較簡易二值化方法,看得到M時就看不到7,看得到7時兩側就全黑了!

這當然要參考每個字元本身與緊鄰地區的亮度對比做動態門檻的二值化,即使我用了很聰明的二值化,如果字元還是不完整?如上面右三位置的8字,拿去比對字模,可能會比較接近HU,但不可能是8!還好,當我們知道其餘大部分的字元,肯定這應該是一個台灣標準的七碼車牌時,我們就有更多線索可以用了!

首先,在此位置(區段)不可能是UH,一定是個0-9的阿拉伯數字,此時有可能的答案就剩下08了!再考慮我可以清楚的看到破碎字元的中央橫線,那就不可能是0了!於是8就變成我非常肯定的唯一答案!福爾摩斯說的:排除所有不可能的答案之後,剩下的唯一可能就是答案了!這不是猜獎,是科學辦案!所以各位就知道我為何超愛看警察辦案的影集了!我天天上班都在玩推理遊戲的!

那用機器學習可以做到跟我一樣聰明的程式嗎?當然可以!但是你要到哪邊收集幾千張這種破碎字元的影像呢?破碎形式都要符合實際可能發生的狀況哦!那樣學習結果才會有意義嘛!我做街道車牌辨識好多年了,磁碟裡至少有幾萬張車牌照片,要我挑出這種破碎字元的照片我也會找得半死都沒幾張。等我的競爭對手收集到足夠的資料讓他的機器開始學習時,我大概已經退休了?

所以真正務實的AI研究要有好的結果,還必須考慮成本效益,你對物理事實的推理能力遠遠比機器學習的技術重要!即使你使用機器學習,也絕對不能輕忽物理現象的理解與推理能力,那才是作機器學習要走向成功的過程中真正可靠的導師!絕對不是拼命買Python或機器學習深度學習的書看你就會有影辨識的功力!不認真研究實際案例的話,你只會越看越糊塗!或許會成仙?但一定沒辦法賴此賺錢謀生!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=154292188