網路城邦
上一篇 回創作列表 下一篇  字體:
逐步聚焦處理,人不是都會這麼做嗎?這才叫人工智慧啊!
2020/07/09 09:28:30瀏覽831|回應0|推薦6

面對下圖這樣車牌模糊的照片,要正確辨識難度很高!即使我有非常聰明的演算法,可以地毯式的搜尋檢視全圖的每一個可能目標,「很有耐心」的找到車牌,但實務上我不能這麼作的!因為辨識時間會拉得很長,如果因為目標模糊我就要辨識好幾秒鐘,那我也別想在市場上混了!

我的車牌辨識除了辨識能力強之外,辨識速度也是非常快的!否則怎麼能在需要高速的動態辨識產品上幾乎制霸全台?上面這張圖我的辨識時間就只需要0.1秒!跟清晰的照片幾乎完全一樣!我是怎麼作到的?沒有甚麼神奇的外星科技,還是從模仿人的思考方式切入做出來的!

重點在於我們人的眼睛看東西時也會先設定大概的目標,粗篩掃描鎖定可能的車牌區塊之後再仔細看!不會呆呆地用最大的注意力盯著圖片逐點找東西的!我會先設定要找全圖最明顯的幾十個目標,大概結果會是這樣:

雖然車牌對比度不佳,連柏油路的礫石反光都比字元亮,但是粗篩出這些目標後,即使車牌字元並不齊全,也足夠看出車牌在哪裡了!接下來呢?我就不必繼續在全圖這麼大的範圍作辨識了!集中火力辨識車牌附近的小區域吧!

 

這第二個階段處理的圖形很小,當然不必花太多時間,還比全圖處理時更加精緻精準!所以才能大約0.1秒就收工!在我最新的i9電腦上做是80多毫秒!一般i7電腦大概就是0.1幾秒了!整體概念就是這樣的,當然實作所有過程需要處理的細節很多,所以研發時間不會是幾天,而是幾年!

我們常說人的智慧很神奇,像這種模糊判斷的能力,就是比傳統硬梆梆的數學公式聰明很多!當電腦程式變得有點聰明時,我們就會說它是「人工智慧」!幾年前我就認定影像辨識就是將人看東西的哲學寫成程式,以前的人在這方面的努力很少,所以我也不必去讀很多書,以自己的視覺思維為師即可,就這樣一路走到現在,也證實了我的想法沒錯,而且真的可以做到!

這就是我影像辨識事業發展的主軸方向了!但是同樣的這段時間,世界上其他地方說的影像辨識已經跟我的想法作法大不相同了!表面上說「類神經網路」好像是師法人的思考方式,但是他們只停留在最低階的反射動作層次,用那個層次產生數學,然後就變成不再思考實際現象成因與資料的關係,只想用統計學的對答案方式湊出可行的辨識流程!泛稱為機器學習或深度學習!

但是真正學習的主體已經不是人類自己,而是自我發展的程式本身!如果這麼作真能解決問題,讓機器變成比人聰明的實體,也算是一種成績!可惜事實上除了邏輯規則非常明確的下棋之類的「工作」之外,這種機器學習的真實成績實在慘不忍睹!他們至今都還不是實用產品開發可以依賴的有效技術。

大家可以認真審視目前各個領域真正有效的人工智慧產品研發,其實做法都跟我差不多!努力釐清人的智慧邏輯與程序,將他們數位化程式化而已!跟孔子說的「述而不作」很類似!如果我們一般人程度的智慧都還不能變成人工智慧的產品,談甚麼發明創新呢?

我們真正需要認真深入研究的東西,根本不是甚麼神奇的新數學方法!而是我們自己的想法啊!想研究人工智慧的年輕後進們,快點覺醒吧!別再浪費時間去玩甚麼機器學習深度學習了!他們只會讓你浪費時間原地踏步的!以自己為師,甚至以小朋友為師,搞清楚人面對問題的詳細思考過程,然後學會用程式寫出來,你就可以變成專家達人了!我的事業就是這樣來的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=142281353