網路城邦
上一篇 回創作列表 下一篇  字體:
這是典型的AI影像辨識詐術:好像可以用?但永遠達不到實用目標!
2021/02/27 17:01:36瀏覽700|回應0|推薦2

動態車牌辨識與EasyOCR

不要以為這是在談甚麼未來產品的開發技術!因為我自己的公司近兩年最熱銷的車載車牌辨識產品,就是一個已經商業化販售,且口碑很好,全台各稅務、監理乃至警察單位都已普遍使用,台灣南部地區的私人尋車業者也已大量使用的這種產品。根據使用者回報的辨識能力,大約是時速四五十公里車速下,辨識路邊停放車輛車牌的正確率仍達到八成五以上,甚至更高!

我有位玩家級客戶,早兩年就開始用i9電腦跑我的程式,一輛車用到三四個攝影機辨識所有方向的車牌,甚至在如上圖的高速公路環境下,都可以辨識到白駒過隙般的「對向」車道出現的車牌。下圖是我的軟體辨識成功後輸出的影像,與上圖是同樣的台灣高速公路上的環境,當他們還在討論如何辨識「前方」車牌的可行性時,我的產品早就可以從路中央隔板的間隙辨識對向車道的車牌了!

所以誰才是專家?誰只是業餘玩家?不是很明顯嗎?他們沒找我寫文章的原因不是我比較不行不專業!而是我的觀點不能替他們推銷他們賴以謀生的AI開發工具產品,他們寫的這些所謂AI推廣文章只是業配文,就是推銷AI開發工具產品與收費課程用的,想誤導讀者以為「專業人士都是用這類工具?」其實根本不是的,我就完全沒用過!其他成功的商業產品開發者也一定不是這樣玩的!這個前提大家必須先搞清楚!或許聽聽不靠商業利益生活的教授們談AI會比較接近事實。

當我看到這種有車牌辨識標題的文章時,當然絕對不會放過!但是仔細閱讀之後,得到的結論依然是:這又是一個半真半假,足以引導很多人「開始」使用這種技術研發產品,但是之後採用的研發單位不論如何努力投入再多的資源與時間,還是不可能達到商業需求的辨識率的!我已經成功的開發技術與經驗跟他們是大不相同的!我證實我作到了,他們還沒有!

我的見解批評不是來自我的主觀直覺,或想貶低異己的心理使然。而是根據我在這個議題上已累積多年豐富的研發經驗,以及這兩年我對於機器學習等所謂AI技術越來越深入學習的認知!我不是隨便批評的,也無須為此非主流的觀點犯了眾怒。他們說的AI技術確實有用,我的車牌辨識產品也已經開始導入,且獲得成效了!

但是很顯然這些推銷AI技術產品的人,使用AI的方式錯了!好像吃藥,他們吃太多了!必定傷身的!以我的認知,對於影像辨識來說,傳統尊重科學發展演算法的OCR等技術,很像正常保健時的飲食或運動,他們推銷的所謂AI(ML機器學或CNN類神經網路等等)應該只是情況特殊時可以幫助解決特殊問題的藥物,你如果把藥物當作主要飲食,永遠不會變強壯的!

以機率統計為主要邏輯的機器學習技術,是可以在資訊複雜混亂到難以作出準確判斷時「趨近」辨識目標,提升辨識正確的「可能性」!但是他們始終不是「針對已知物理事實,設計合理演算法為主軸的精確科學」。影像辨識要達到正確,過程中牽涉的變因確實很複雜多變,但絕對不像股票市場或人的命運那麼難以捉摸!

事實上,傳統的已發展半個世紀的OCR等技術已經將影像辨識大部分的理論邏輯方法建立得差不多了!但是當影像辨識進入百萬畫素的時代,前面數十年間以幾萬畫素為基礎研發的影像辨識技術,當然顯得有點捉襟見肘,但這不表示OCR的傳統科學研究方式已經過時應該淘汰了!基本原理永遠不會變的,技術方法也只是需要時間進化而已。

但是有些人開始失去踏實研發的耐性,適逢機器學習等技術興起,就很努力地想改用機率統計等跳脫物理思考的數學模式來達到影像辨識的目的!就像大多數的統計應用,很快就可以得到「初步」的成果,但是永遠無法達到「精確」的判斷!如果我們因此輕易放棄傳統的OCR辨識程序,直接認定CNN就是未來唯一的影像辨識主軸,那將會是一場科技大災難!太多公司將因此陷入研發困境而倒閉!

因為那些數學邏輯是以降低人為辨識與機器辨識之間的誤差為研究主軸,而不是真正在研究理解「為何辨識失敗」的科學原因?所以他們其實是崇尚「忽略物理事實研究」的「偽科學」!如果真能達到使用者需要的辨識目的,其實也沒太大的關係,如果占卜就能有效決定國事,甚至比尊重科學方法更好!你能說甚麼?古時候科學還不夠發達時,不就是這樣的嗎?

但我們現在的科學研究,應該已經發達到不必處處都完全依賴機率統計來「算命」了!並不是數據資料量多了就「非使用機率統計不可」!不管資料數據有多少,不管決策的變數有多少,我們還是應該先使用傳統科學中,已知的原理與合理演算法,去消化可以處理的資料或資訊,只在已知科學無法精確處理的部分,才是目前這些機器學習相關技術可以產生最佳效用的地方!

簡單說,在影像辨識領域,以嚴謹科學為基礎的OCR技術才應該是主角與骨幹,AI技術是可以擔任科學未知或未確定領域的探索者,或無計可施時的急救者!但如果醫院裡每個正常門診都使用急診室的搶救病患醫療方式?如果公司裡明明可以分析資料或開會討論合理作決定的事情,老闆卻堅持都要用算命卜卦的方式來決策?那會多亂啊!

建議大家別給這種文章輕易迷惑了!他們只是推銷AI開發工具(或教材)的生意人,不是他們自己真能作出商業產品,他們差遠了!不像我是研究這個議題已經真的達到實用產品開發成功的地步!或許他們是說:走他們的路也可以做到我作的事情,甚至可以做得更好?但是事實是他們整個門派中都根本還沒有人爬到我已經身處的高度!我說的是全世界的範圍內,根本還沒有他們說的那種AI技術開發出來,而且堪用的商業級車牌辨識產品!我就是在車牌辨識應用的市場上混的,我知道的!他們只是隨便說說的,你不要隨便相信!

你覺得應該比較相信誰說的話呢?我的建議是:想真的讓自己可以做影像辨識研發的工作,先好好學習傳統OCR的影像處理與辨識技術才是正途!先打好科學OCR的基礎,等到你真的遇到OCR表現欠佳的問題時,再學那些所謂的AI技術不遲!一開始就用那些技術處理問題,我保證你哪裡都到不了的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:http://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=156877450