網路城邦
上一篇 回創作列表 下一篇  字體:
ML與DL的最大痛點:他們不願意回歸傳統科學的隊伍!
2023/01/08 05:26:52瀏覽1541|回應0|推薦8

如果以上面的簡單示意圖為架構來說明,機器學習與我做的影像辨識,或其他AI專案,最大的一個實務差異,就是我解決問題的「模型」,不只是決定我要Extract(擷取)甚麼Features(特徵)?還包括所有我為何擷取那些特徵?擷取後我要怎麼「組合」那些特徵?來達到最合理最準確的辨識效果!我的導師當然是數百年來已發展成熟的物理科學

我的模型當然也需要很多資料的驗證調整,才能越來越AI!就跟傳統科學研究的任何假說要變成可靠的理論都需要不斷的實驗驗證一樣!如果操作正確的實驗顯示我的假說有錯誤或疏漏,我就必須回頭調整假說,再做下一輪的實驗!所謂的機器學習的始祖就是傳統科學的實驗統計驗證

機器學習和我的作法,也就是傳統科學不同的是:他們相信實驗統計的結果「可以」取代複雜思維的模型建構與調整的研究過程!我是當然絕對的不相信!對我來說,上面的流程中那個坐著玩電腦的圖示應該大三倍,Classification的網狀圖示應該小三倍,或視為前者(模型研究)的一個SOP(做實驗)不必顯示了!

但是機器學習派顯然跟我和傳統科學研究的理念背道而馳!當機器學習實際上遇到瓶頸,在絕大多數真實世界想生產AI的案例中普遍碰壁時,他們不怪罪統計學只看數據忽視科學的基本問題,正如傳統的升學主義只看考試分數一樣狹隘!反而逆勢操作?將ML流程中坐著玩電腦的程序,都交給資料自己決定了?他們還更高調的說這是「深度」學習!

雖然我不支持機器學習的概念,但是因為與我的工作有關,這些年我一直以最嚴謹的學術態度在持續關注他們的發展!當機器學習受挫時,也有一派思維稱之為監督式學習強化式學習!其實就是發現機器學習假設特徵都是獨立變數加以統計,與事實有太多差異例外,導致「學習」的結果有太多無法克服的誤差。

所以他們開始考慮「人為介入」機器學習的過程與結果!但是他們很難承認必須回頭求助於傳統科學的邊界條件或物理公式,也就是以被他們視為過時的「專家系統」開發概念來精進他們的AI!還是堅稱他們是Data Driven!是資料本身告訴我該如何修改模式的!絕對不是物理、化學、生物或經濟學!他們自稱是人工「智慧」的核心技術,卻有意無意間輕視忽視傳統科學才是更高「智慧」的事實

既然還是資料決定的,那就用更複雜的統計學,來決定哪些資料條件可以用來修改模式吧?這就是DL的濫觴了!就是這樣,他們死不認錯,不願回歸正統科學,不願拋棄自己的神秘面紗,只能繼續用資料統計解決所有的科學事實問題!正所謂的不到黃河心不死?或是不見棺材不掉淚?太多的ML與DL跟隨者就此加入跳崖的隊伍,準備一起陪葬了!

我看到的關鍵點就是:海量資料確實可以提供無窮無盡的特徵!但是它們之中有太多都是互相影響,互為因果的非獨立變數!它們是如何互相影響互為因果的關係?就是傳統科學研究了數百年的內涵!刻意跳過個案的科學分析研究,只用統計學決定AI的結果,當然是扶東倒西左支右絀,只能盡量求得平衡,永遠無法兼顧所有個案例外趨近完美的!

以影像辨識的AI為例好了!如果你堅持不研究分析物理的因素,使用一批以A牌攝影機拍攝的影片讓機器學習辨識某目標!這個AI產品碰到B牌攝影機拍攝的影片時,就會表現變差!如果你讓這個AI同時學習AB廠牌的資料,那資料量與成本就會增加,還因為辨識參數必須兼顧妥協更多資料與參數,整體辨識率還會降低,辨識速度也變慢

除非你徹底用物理科學研究例外的個案!具體理解為何適合A的參數會在B的某些案例中失敗?用「科學原理」來精進你的AI直接放棄一些跟你需要辨識目標無關的參數!提高跟目標辨識有關的關鍵特徵參數!那樣你的AI辨識率才會進步,還有附帶紅利是辨識速度會大幅增加!因為你不再是「普查」所有特徵,而是根據你要找的目標「抽檢」!

機器學習是時候應該考慮放棄神秘面紗與過度浮誇的光環,回歸真正的傳統科學隊伍了!你們原本就只是一個計算探索歸納整理資料的工具!不是沒有價值,但價值就僅止於此了!AI當然是我們必須追求的目標,但機器學習絕對不可能是關鍵的主角!沐猴而冠也沒用的!還是乖乖跳上主人(科學)的肩膀,扮演好你的角色吧!

( 知識學習科學百科 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=178048196