網路城邦
上一篇 回創作列表 下一篇  字體:
可以逼近,但永遠無法超越!
2020/12/26 04:22:27瀏覽935|回應0|推薦7

現在常常在看用CNN做影像辨識的相關文章介紹,剛開始確實有點憂心,自己使用OCR傳統影像辨識技術為基礎的事業,會不會不堪CNN一擊?一下子就被這股新浪潮所淹沒?我在資訊領域討生活也二十多年了,從DOSWindowsWebSQLApp的世代,我都是超前佈署的!每個資訊技術的海嘯我都早早準備好,也跟上並順利跨越那些時代了!

但是在這些適應學習資訊技術的過程中,我也做過很多反流行的選擇,而且事後證明我的判斷都是對的!在進入視窗時代時,C語言已是貴族,VB則是庶民,其實我都會用!但是我選擇VB為主要開發工具,C語言只作為閱讀工具,結果是我的各種研發研究的速度都比使用C快出兩三倍!

C寫作時,不只是製作操作介面時效率不如VB,一般人比較不知道的是:一進入複雜邏輯就會因程式碼的拘謹繁複變得很艱難,如果我是用C語言的人,應該無法如此快速深入影像辨識的核心實作領域。我不是為了挺VB瞎掰的!如果C語言開發複雜的AI演算法沒問題,那為何會出現Python?不過就是跟VB一樣較為友善不囉嗦而已,還不如VB容易直接開發軟體。承認吧!C語言真的是一個非常不友善,讓人很難專注思考演算法的爛語言。

之後Web興起,我也是立即選擇ASP,力抗起初專家們看好JSPPHP的主流思潮!兩年之後就證明我是對的!PHP逐步式微,最被看好的JSP更是無影無蹤了!這些專家們後來都不說話了!App的狀況也是一樣,剛開始都說要做App一定要學Java,我認為不是!我當時就是系上教程式設計的主力老師,但是禮讓了Java的課給另一位老師,反而主動爭取去教網頁設計?教出一大堆HTML5很強的學生,他們才是後來市場上最需要的App工程師,好像沒人提Java了?

現在我對於CNN製作影像辨識軟體的看法,也是跟主流專家相反,我不覺得那是可以挑戰傳統方式做出高品質影像辨識軟體的技術,他們只是在研究如何做出「堪用」的軟體而已!就是找出數學統計的捷徑,在不必研究實質問題的前提下,套公式做到「好像對?」的程度,只要有八分相似,他們就會興奮到開香檳了?簡直是走火入魔。

至於之前的影像辨識專家已經能做得不錯的領域如車牌辨識等等,CNN其實只能實驗性的嘗試「接近」專家的能力水準,絕對無法比肩甚至超越!精準瞄準射擊的狙擊手怎麼可能輸給靠手氣亂槍打鳥的人呢?但弔詭的是:他們就是用自己的猜題技術「已經逼近專家水準」的事實,暗示幾年後就會比專家厲害了?投資我吧!如果加註「永遠不可能超越傳統技術製作之影像辨識軟體品質」,那就沒人投資了!但事實就是如此!

我可以預見幾年後的影像辨識軟體市場是這樣的:真正準確度高速度快的軟體依舊是使用傳統技術開發的,但是會有很多CNN技術開發出來的堪用(塑膠?)產品,而且因為大家都能很容易製作達到一定的水準,必然陷入低價流血競爭,那是一個紅海市場。如果CNN真的踹出一些傳統技術原來很難辨識的東西,當然會很快被傳統科學專家吸收到「傳統」軟體之內,統計基礎的CNN則很難吸收仿效科學家的精準邏輯,這是一場CNN永遠贏不了的戰爭。

所以至少我很確定!在十幾二十年內這些只是嘗試「逼近」,而非對症下藥解答問題的影像辨識技術,絕對不會威脅到我的生意,至於更久之後會發生甚麼事?那應該就跟我無關了!想要跨進這個領域的年輕人小心了!最好你所有技術都學會,但只專注在CNN之類的技術,你到死都只能做出「很像」傳統專家品質的軟體!這是你的理想抱負嗎?

其實好像也不必說得這麼尖銳,將CNN技術拆開來看,按照特定的辨識目的準確地引用到合理的傳統辨識流程架構中,他們還是有很多好的新穎方法設計,我最近的車牌辨識核心改版也是這麼做的!以後也會繼續這樣彙整引用。簡單說,就是主從架構必須合理有彈性!多數時候堅持CNN的主辨識流程是不洽當的,事實上不會省事有效率,改作配角就會更快產生很大的效益。

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=154874000