網路城邦
上一篇 回創作列表 下一篇  字體:
面對巨量資料你該怎麼作?我會怎麼作?
2022/11/17 04:40:55瀏覽1423|回應0|推薦9

現在最流行,被刻意炒作的所謂AI影像辨識科技,已經被誤導到似乎「必須」以機器學習(ML)、深度學習(DL)與類神經網路(CNN)為核心主軸?這是一個天大的詐騙謊言!這類科技的基礎就是「大數據」,也稱為巨量資料,或Data Driven的技術,就是由大量資料的統計運算找出最佳的演算法!

但是不但學術理論上就不應如此,現況的影像辨識商業產品也完全「」以這些MLDLCNN技術為核心!未來預期也不可能以機率統計得到真正高辨識率的影像辨識軟體!以我這個實際從事這個產業七八年,且已經有很多商業產品成功開發實績的人來看,這種亂象真的是荒謬到極點!但是連學界、業界大公司,到升斗小民,似乎都已經深陷這個詐騙迷霧之中了!

其實面對這種荒謬的假AI亂象,我並不算是受害者,反而是得利者!因為凡是相信那一套AI技術的人或公司,其實至今都沒有做出夠好的研發成果,可以威脅到我的市場競爭力!照我的理念方式,我做影像辨識研發總是可以直接扣倒那些宣稱使用AI技術的團隊!囂張到類似金庸小說中的獨孤求敗!

更諷刺的是:我目前的多數專案客戶,之前都曾被那種假AI公司團隊詐騙過!就是宣稱他們有最「先進」的AI技術,就是MLDLCNN等等!但是花了大錢曠日廢時還是無法達到計畫目標,被耍騙了兩三年後找到我,只用兩三個月就以十分之一的價錢達標了!這是鐵的事實!

我不是甚麼科技恐怖份子?妄想顛覆瀰漫全球的AI浪潮!我只是有話直說不想憋著而已!改變世界是我行有餘力後的一個期望而已,我每天還是努力用我認為對的方式繼續工作前進!但是我絕對不認同MLDLCNNAI影像辨識的主要技術!連稱之為「重要」技術?它們都完全不夠格!

但是有一點我和那些AI技術是有共識的!就是必須有足夠的資料作為研究的基礎!資料越多越完整當然可以讓我的AI更有智慧,至少我可以藉著巨量資料驗證我的研發成果!但是我不會放任用資料統計來決定我應該如何辨識我和客戶想要的目標!

那真的太愚蠢了!如何正確辨識目標這件事早在ML熱潮之前幾十年就很成熟了!我看書寫程式辨識車牌的正確率就已經遠超過使用ML資料統計做出來的車牌辨識系統!我一樣可以取得大數據,重點是我怎麼使用呢?我會相信用那些資料統計來得到我要的「智慧」嗎?除非我是白癡!

具體的說,我用傳統OCR等技術建立好我的車牌辨識核心,辨識率就已經很好了!比使用ML等技術逆推巨量資料的系統辨識率好很多了!當我拿到巨量資料時,我需要思考的是「例外」狀況!

世事多變,我的辨識核心只是以科學理論為軸心建立的!如果我可以利用巨量資料偵測到例外,也研究出對症下藥治病的藥方,我的整體辨識正確率不就可以在「既有的基礎」上穩定提升了嗎?我的辨識軟體都是這樣達到客戶滿意的高辨識率的!無往不利!

最近的例子就是有位車載車牌辨識的客戶嫌我的辨識速度還不夠快!我就說你將你在馬路上擷取的影像給我研究,我必有所成!他隨便錄製一天就給了我兩千多張照片,我也藉此一周之內內就讓整體辨識速度快了非常多!

我完全沒有跑統計歸納之類的運算!就是老老實實地將兩千多張影像用舊程式辨識然後目視比對,答案不對的或耗時過久的就一一個案研究流程,找出不利的因素之後就修改辨識流程,讓辨識正確率提高的同時,也努力減少不必要的運算量,辨識速度就快了!反正就是一一診斷對症下藥就對了!多年來我一直都是這麼作的!完全不需要MLDLCNN就做得又快又好!

我真覺得白癡才會用MLDLCNN作影像辨識,因為真的沒必要也超沒效率的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=177485076