網路城邦
上一篇 回創作列表 下一篇  字體:
影像辨識開發的專業與業餘差異
2019/08/24 04:09:01瀏覽1972|回應0|推薦14

現在說到要學影像辨識,大家的認知都是要去學Open CV,要去學機器學習,前幾天有位有意讓公司開始能作些影像辨識工作的客戶來訪,也說他們有個很棒的軟體,可以將二值化等影像辨識流程動作自動完成云云。我當場就潑他一盆冷水:如果你只是想當業餘的,這樣玩還可以!那些工具軟體其實是捷徑而非正途,真的要走向專業應該不是那樣玩的!

我的看法是:一旦你決定使用這些工具「開發」你的解決方案或影像辨識產品,你已經注定不會變成一個專業團隊,永遠只是「業餘」的玩家!就像一般人開車、買車或玩車一樣,你不會因此變成修車技師或賽車手,你就繼續當只剩一張嘴的所謂「達人」吧!那些口沫橫飛的3C達人哪一個真的能寫個App來賣呢?

我現在靠著賣車牌辨識軟體,以及開發各種特殊目的的影像辨識專案維生,公司開到第五年還活得好好的,已經有幾十個停車場用我的辨識軟體,所有稅務單位都跟我買軟體抓逃稅車,我絕對有資格自稱是個影像辨識的專家了!但是我們開發這些產品的過程中,會用到的只有VB.NET程式環境,以及PhotoShop軟體,最多加上小畫家吧?

我們的電腦中真的連Open CV或最基本的機器學習相關的工具環境通通都沒有!因為那些工具,甚至包括PhotoShop裡面的所有功能,如果我有任何一項會用到的功能,無法自己用程式語言實作出來,我就沒有資格自稱是影像辨識專家,也絕對沒辦法經營出今天這個可以生產影像辨識產品的公司!

不要誤會我「排斥」使用那些熱門的影像辨識工具!我沒有排斥,而是真的知道不能依賴他們解決問題,我們工作中是常常使用PhotoShop,但只是用來協助我們了解問題,分析問題,有點像是醫院裡的檢驗工具,不是醫療工具!我們不會拿其他軟體或函式庫中的任何影像辨識相關元件模組加入我們的產品,因為那樣做很笨!

不是怕會侵權哦!單純就是因為那樣作很笨很沒效率,我們如果自己就可以寫出二值化等程式,也確實可以掌握影像的問題,隨時可以寫出程式實驗解析各種演算法的效果,我們就不必使用那些模組黑盒子,自己寫的程式也更容易調整各種細節參數。最終就是做出非常準確快速甚至簡潔的高效率軟體!我的停車場多車道動態辨識軟體執行擋只有400K!且不必匯入任何影像辨識相關的DLL,我的軟體中只會有一個軟體授權認證用的DLL。

不要誤會我是天生個性孤僻龜毛,加上思想偏激,所以堅持不用既有的影像辨識資源與工具,就是要自己寫出所有的程式碼來炫技?真的不是這樣的!一開始是因為我真的會寫嘛!就用自己寫的程式比較自在有彈性,走了一段路之後就知道,那些想藉著使用現成工具跳級跟上或超越我的人都玩不下去了!想用既有的程式模組為主體組裝影像辨識產品,是很低階業餘的想法,很快就能作出「堪用」產品,但永遠無法變成「好用」的精品。

這很像一個人其實只缺一種維他命,但是他不太了解是缺哪一種?或是剛好市面上買不到那一種,就猛吃綜合維他命十全大補丸,結果身體負擔太重反而出現了一些異常病徵,又要吃些其他的藥物來鎮壓,很快就變成一個藥罐子了!如果我是專業醫生,可以對症下藥,或許只交代病人吃某種水果病就治好了!現在你應該知道軟體產品中有一大堆DLL的原因了吧?那不是專業的表現,那是業餘水準的RD想盡量不寫程式就拼湊出專業軟體的尷尬慘劇!

我其實沒認真有系統的教過任何學生作影像辨識,唯一的RD也是當學徒一樣看著我作學會的,但是我可以清楚的告訴所有想學做影像辨識的人:要學好影像辨識,「必須」學好影像處理與辨識的基本理論概念,就是一定要先認真讀書啦!光是學會如何使用Open CV好似參觀過熟悉了羅浮宮的導覽,就希望成為藝術鑑賞大師,不可能的!

同時間,你也一定要有很好的程式實作能力,每一個影像辨識所需的基底函數功能都必須能自己用程式實作出來!還要有豐富的常識與靈活的頭腦,至於你會不會用Open CV或機器學習完全無關緊要,你絕對不會因為能使用這些工具就更快進入「專業」領域,事實上是反而會產生一些誤導的觀念習性,讓你更難變成有生產力的專業人士,徒然浪費了你原本可以打好基礎的寶貴時間。

我可以大膽推測,目前所有可以推出有競爭力(高辨識率)的影像辨識產品的公司,都是以自行開發的演算法程序為他們軟體的主幹,絕對不是依賴目前流行的機器學習或深度學習技術為技術主體。他們有些會刻意這麼說,其實應該是受到流行風潮的壓力,不跟現在已經被誤導的AI狂潮扯上關係,怕客戶覺得不夠「先進」不買單!等過兩年這波機器學習與深度學習被過度誇大的潮流泡沫化之後,大家就會跟我一樣實話實說了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=128768252