網路城邦
上一篇 回創作列表 下一篇  字體:
銳利化為何有用,你知道原因嗎?
2021/04/07 08:19:32瀏覽1017|回應0|推薦9

夜間拍到的路上車牌大概是這個樣子的,看起來好像不難辨識?但那是以人腦聰明的視覺來看的,要用影像辨識程式來辨識,就是一個挺困難的問題了!將影像灰階化放大來看是這樣子的:

這和白天看到的黑白分明的車牌很不一樣,原因是光源不像陽光一樣均勻,在亮度相當起伏波動之下做出來的二值化就常常造成如下的字元沾連:

能做成這樣都不容易了!我已經用了動態門檻值的演算法來做二值化,但是當局部亮度起伏實在太大時還是力有未逮,後面四個字都沾到一起去了,自然很難一一辨識是甚麼字?但是如果在灰階圖的階段多做一次水平方向的銳利化,灰階圖與二值結果就會變成這樣:

乍看起來好像差不多?但是至少把四個沾連的數字「部分」切開了,只剩下中間的80兩字沾連而已。這樣就好處理多了!以我的辨識程式來說,四字沾連時是一定無法辨識成功的,只剩兩字沾連時就可以正確辨識了!

現在被浮誇的AI宣傳唬弄之下,很多人會妄想有甚麼神奇的演算法可以直接將模糊的影像變得非常清楚?我也很想啊!但是在這裏面玩了好多年,越做就越肯定沒有這種東西。合理的AI研究應該是對症下藥,當我知道水平方向的字元沾連會讓我常常無法將字元順利切開辨識時,我就要找到可以減緩這種現象的處理方式,或者說強化水平方向的亮度變化幅度,讓垂直方向的切割更容易一些!

這是一個精確合理的推理過程,如果你只是用機器學習的膚淺概念,亂踹一些增強影像的方法。第一個問題是會浪費很多時間;第二個問題是當你在數十種方法中,終於找到可以最大機率成功辨識的方法時,因為你不清楚為何有此效果的機制,只能將它視為「經驗」!

其實這就代表你無法以此為基礎繼續研發做得更好!好像胡亂堆積出來的一個積木高塔,靠運氣堆得好高沒倒下,但是你也不敢再去動它了,可能再加一塊積木就會全倒了!所以即使你可以靠著機器學習探索出一些有效的方法或參數組合,你的下一步還是必須盡可能理解為何如此會有效的機制原因?不然你的研發就到此為止了!

以我的研究習慣是絕對不會做無謂的嘗試的!當我發現夜間辨識率變差了,我就會去探討確實的原因,看看是哪一個環節讓我的辨識之途迷路了?找到病因之後再到藥房找我認為可以治病的藥,我對病況越能掌握清楚,找到正確藥方的機會就越大,耗費時間也越少!

我認為AI科技的主軸應該不是找到一個人類完全沒想過,也無法理解的神奇演算法,機器學習可以是很好的探索工具,但是要靠它直接找出最聰明有效的演算法機率很低,就像你不太可能靠著買彩券致富一樣!如果不必動腦筋,只用機器學習工具模組就可以解決的問題,表示大家都能不知而行的做到,那它的價值也就不高了!你沒辦法靠它賺錢謀生的!

總之,天下沒有白吃的午餐,真正有效有價值的研究還是必須認真動腦筋去思考的!如果你只是使用者當然可以輕鬆花錢享用AI科技。但如果你是研發者,不能充分理解的AI技術,對你的研發是毫無用處的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=160111080