網路城邦
上一篇 回創作列表 下一篇   字體:
能辨識這麼模糊的車牌,關鍵不是AI,是不放棄的精神!
2024/03/24 05:06:07瀏覽666|回應0|推薦5

我不喜歡現在AI科技的宣傳方式,原因是他們總是喜歡故弄玄虛,把很多可以理解的科學邏輯蒙上神秘的面紗,然後貼上AI的標籤?目的只是為了蒙騙大眾提高產品身價!如果他們是使用機器學習等技術,讓電腦自己根據資料去做機率統計,他們也很難替統計結果提出精準的科學解釋,乾脆就呼攏客戶不解釋了!以科學家的角度看,這是很不負責任的作法,也讓這種AI難登精確科學的大雅之堂!

我不喜歡這樣,所以即使我的影像辨識做了一些超出一般人預期的辨識結果,我都不會用AIAI的煙霧來唬人!我寧願說自己是用「科學」做精準研究的專家,也不喜歡把自己的工作貼上已經幾乎被濫用到汙名化的AI標籤!也奉勸大家醒醒,別管甚麼AIAI了!在影像辨識領域,AI只是辨別是否詐騙的關鍵字

我最近在根據一批很難辨識的機車車牌影像優化升級我的車牌辨識核心,和機器學習派不同的是:我的「機器」沒有很忙,而是我的大腦很忙!我的辨識核心就是一個很複雜精密可以處理很多例外狀況的機器!每當它無法正確辨識某張影像時,我就會逐步追蹤這個影像在我的機器裡面經歷的所有過程!

以我當老師的經驗來比喻,很像一個在教育體系中失敗的學生,我們會個案分析他的家庭環境、心理與生理狀態、受教育的過程中接觸到的老師、同學與環境等等,找出讓他失敗出軌的原因,然後尋求補救。

作影像辨識比做好教育工作簡單多了!因為所有事實發生的過程更加明確,都是數位資料的處理過程,絕對可以明確追蹤,發現問題後也不像教育孩子無法時光倒轉重來一次!做失敗的影像辨識永遠可以無痛補救再來一次,反覆更改程序做到好為止!這就是我的日常工作了!比當老師時的工作沒有比較少,但都是明確可掌握的工作,作錯也可以重來,壓力小多了!

如上的神奇辨識就是一個很有趣的案例!我可以帶大家到我的透明廚房看看是怎麼作到的?基本的前提很簡單,就是像理想的教育理念「一個都不能少」!在前處理中我必須把任何可能是車牌字元的目標都找出來,在CNN的過程中就是用Convolution找出所有可用的特徵了!差別只是我是使用OCR的邏輯建立我的獨立目標群。

只要物理事實上這個影像中真的有車牌,這些散亂的目標群中一定有某個組合就是我們要找的正確車牌!如果車牌影像非常清晰,我們就可以用一些簡單的邏輯條件迅速的找到正確的組合答案!就像一個身心健康智商超高也願意讀書的孩子,用最簡單的教育體系就可以很容易讓他成功出頭!

但如果是個其實可以造就,但是很多方面很不典型的特殊孩子呢?就像上例中模糊的車牌,它確實是個車牌無誤!但是對比於其他可能的目標是很不清楚,很不像正常字元的,怎麼辦呢?當然就是要堅持下去排除所有「看似卻不是」的資料組合,耐心的找到這個客觀條件不好,但卻符合所有車牌必要條件的隱藏版大明星了!

具體來說這個案例中我的程式做了1585的組合嘗試才找到它的!這當然代表要找到這個模糊的答案需要較多的計算,辨識出答案的速度會比清晰影像慢,實務上如果慢到讓使用者難以忍受,就是理論上可行但現實上不可行的純研究了!對於我這種需要作出能賣的產品才能活的業界廠商來說就是失敗了!

那怎麼辦呢?其實就是努力精簡找到這種目標的過程了!或是去買輝達的超高運算量晶片?我和我的客戶都想盡量省錢,所以不到走投無路是不會走這條路的!還好我的精簡流程研究很成功,所以這張影像的辨識時間跟一般正常影像相差無幾(如下圖),所以我才能在這個影像辨識的市場繼續活得很好!

所以不要再隨便相信AI會讓甚麼超自然的神奇事件發生了!即使是複雜如影像辨識這種事情,每一個過程環節也都無法逃脫上帝建立的物理定律管轄的!所謂的:事出必有因,天下沒有白吃的午餐,等等亙古不變的金玉良言也都完全適用於AI科技的!當然努力研究出更好的高效率演算法就不必太依賴昂貴的新硬體,這才是更環保的AI研發方向!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180427815