網路城邦
上一篇 回創作列表 下一篇  字體:
他們說的AI其實不包括影像辨識,你知道嗎?
2021/11/25 05:16:50瀏覽995|回應0|推薦6

入行AI最需要的五大技能

面對這種說法,我只是一個影像辨識的專業工作者,我已經用我的實績證明,在這個領域我做得很好!不僅車牌辨識核心已經商業化銷售之中,完全無懼全世界的各大廠牌車牌辨識的挑戰,不管是辨識能力與速度PK的場合我從來沒輸過!都是輾壓式的大勝!

同時間,我的公司也是台灣目前很多種影像辨識客製化研發的原廠,譬如在閱卷辨識的市場,我們已經是最重要的原廠!多數文化出版業推出的閱卷軟體,包括手機閱卷APP,辨識核心都是我們作的!還有一些其他公司文件與證件辨識的產品,我們也取代了來自大陸與歐美的辨識核心,變成他們技術的源頭了!

這些都是大家可以去肉搜驗證的事實,我們的公司窩居台南麻豆鄉下,卻還是有生意可做,都是客戶自己上網作功課之後找過來的,他們也都沒有失望!但是在此說這些,重點不是行銷!我想要獲得的只是一個合理的發言權!比起賺錢,我更想用我的專業意見導正釐清AI科技亂象,讓世界更快因為AI產業變好。

無疑的,影像辨識應該屬於AI產業,而且是最困難也最重要且廣用的一個項目!其實在目前這些所謂AI技術出現熱炒之前,影像辨識技術與產業已經默默發展超過半個世紀了!30年前我在博士班研究地形辨識演算法時,影像處理與辨識就是相當穩定成熟的技術了!你們知道嗎?40年前聯考閱卷的讀卡機就是影像辨識的應用了,你們有意識到嗎?

為何大家當時都沒看到?原因只是電腦科技環境還跟不上那些先驅科學家的智慧,影像資料太多太大,運算量無法在一般人可以企及的電腦設備上實現,只有在NASA或少數尖端實驗室才會看到沒有機器學習概念之前的影像辨識技術已經有多好了!

我自己讀博士班時,用一般電腦演算幾萬個畫素的影像,處理程式就要跑幾十分鐘甚至幾小時,你認為那時這種程式可以變成一般商用軟體嗎?如果辨識一個車牌影像要等5秒或10秒鐘,可以在停車場使用嗎?如果要能立即反應,停車場管理單位會願意花幾百萬買超級電腦,只為了可以辨識車牌嗎?

所以並不是影像辨識的軟體技術一直都不夠好,所以沉寂了幾十年,它早就研發得很好了!它需要的只是更好的電腦環境,現在也有了!它完全不需要近年興起的那些AI科技,本來就會開始爆衝讓所有人驚豔的!即使現在大家熟知的AI技術完全沒有出現,這也是必然會發生的現象。

這幾年以機器學習為基底的所謂AI科技,其實是以機率統計為技術核心,面對大量卻邏輯脈絡還不清的資料與情境,他們獲得了很有經濟效益的成功!譬如估計股票漲跌或客戶消費傾向,超過60%的判斷成功率就可以賺錢了!語音辨識超過80%的正確率,大家就會很驚艷了!Siri偶爾聽錯了,再講一次給它聽,大家都還是愛它的!

但是當他們橫柴入灶,硬要強加這些所謂的AI科技來「解救」影像辨識時,其實是非常奇怪不合理的!因為影像辨識的這個領域與之前他們成功的資料領域完全不同!要求達到的辨識正確率也完全不同!一個會用PhotoShop軟體P圖的人對於一般人來說很厲害,但是當他說可以幫忙或取代一個真正的畫家呢?

現在的所謂AI科技跨足影像辨識的關鍵矛盾就在這裡了!影像辨識的技術領域早就成熟到超過必須使用機率統計來解讀混亂無序資料的層次,硬要引用機器學習等等機率統計為基礎的技術,只會讓影像辨識的成功正確率倒退。不需要AI科技的協助,傳統的影像辨識技術本來就可以辨識率>90%!靠著電腦環境的進步,它們本來就可以順利商轉了!有了低成本的研發環境,像我就可以用自己的電腦研究,讓90%變成98%了!不必到中研院借用超級電腦了!

鐵的事實是:幾乎所有的商業用影像辨識率需求都是趨近百分之百!停車場車牌辨識率90%已經是很糟糕的水準,但是股票估算軟體60%成功率就很厲害了!我們是應該選擇在90%的基礎上研究精進?還是放棄已經有的90%辨識率,重新以60%的「AI」技術基礎,來開創我們的AI新紀元?我選擇的是90%的起點,為何反遭質疑呢?笨蛋才會選擇60%吧?

這些年來面對排山倒海的AI技術風潮,我的壓力也是很大的!我持續大量為文批評以ML為基底的AI入侵影像辨識領域,絕對不是無的放矢,而是情非得已!它們真的礙著我了!一方面我繼續堅持以傳統影像辨識的基礎來經營我的公司,也一直做得很好!卻必須持續面對無聊無用也無謂的AI技術質疑?我不用CNNMLDL,所以我就是技術科技落伍跟不上時代的爛公司嗎?我完全無法接受!

為此我還努力自學那些AI科技,甚至讓我的RD不減薪不請假就去讀研究所,學習那些AI科技?但是至今我們公司獲得的「那種AI技術奧援微乎其微,如果是以投資獲利的商業觀點,AI技術學習的投資是讓我嚴重虧損的!我必須繼續作是因為大家都被騙了!如果我不理會不學習這些技術,我無法向已經被洗腦的廣大客戶解釋為何我不用那些技術

這是很愚蠢的狀況,就像一位醫術精湛已經救人無數的醫生,必須整天忙著如何向無知的病患解釋:我為何就是不肯用算命卜卦的方式來治病呢?就是完全一樣的荒謬!如果你問我:入行影像辨識需要學會甚麼東西?我會說:你最不需要的就是機器學習!我就是很成功的影像辨識業者,我就完全沒用到那些東西,機率統計概念需要時我也會用,但完全不必學機器學習那一套,你要相信我?還是那些自己都沒作出過商業化影像辨識產品的人?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=170595633