只教你數學，沒教你物理，你能去到哪裡？ - 鄉下老師

字體：小中大

只教你數學，沒教你物理，你能去到哪裡？

2020/12/07 09:24:58瀏覽959｜回應0｜推薦8

ML Lecture 2: Where does the error come from?

現在的我真的好努力在學習「機器學習」！除了旁聽RD的研究所老師指導之外，也會找些書籍或網路資訊學習。還好教材很多，這個系列的視訊教學口碑就還不錯，台大資工教授的線上課程哦！很多名詞與數學架構都更理解了！基本上還是以機率統計的觀念為核心，我沒正式上過機率統計的課，但玩資料的經驗夠多也都能理解。

大家知道我對機器學習批評很多，但是我不會任意否定我不懂的東西！我只是覺得要高效率高準確率的解決問題，並不是非用機器學習的統計概念不可。隨著我繼續深入學習機器學習，這種概念其實更為堅定！

我發現機器學習是提供一個可以將大量資料納入統計架構加以運算的工具，但是繼續深入開始面對明確的問題時，就會發現：你還是必須跟我現在做的工作完全一樣！用很多具體的物理概念來將資料合理的量化。如果想要真的步向解決問題的目標，其實機器學習使用者還是必須做好我作的所有事情！他們還是需要建立很多Function或Classification的屬性或規則的！胡亂採用別人既有的Fnctions或Rules只會讓你浪費時間處理一大堆垃圾結果。

那機器學習對於我來說有甚麼可能的好處呢？其實好尷尬！以我解決問題的經驗，如果可用資料不足時，我的解決方向是使用可用資料以外的常識、物理定律或法規等等邊界條件建立獲得正確答案的規則，因為強行找到更多資料，利用統計方式讓答案收斂趨向正確的成本實在太高了！其實機器學習的研發者也差不多是這麼作的，他們稱這些外部條件為先驗概率(Prior probability)！就是不必看資料就已經知道的一些限制條件。

反之，如果我真的有足夠的資料可供研究時呢？其實利用資料的個案分析與測試，我就可以建立出準確率極高的判斷流程，也就不需要讓大量資料進入機器學習的統計架構來獲得更正確的答案了！重點在於我習慣使用更確定的邊界條件與個案實驗結果「證明」我的判斷流程的正確與否？通常都可以達到比機率統計更可靠的結果，也就是程式邏輯，至今我還看不出機器學習可以對我日常在做的研發議題有明確的幫助。

所以我目前對機器學習的看法沒變！當你可用的資料與物理條件不足以得到高準確率的答案時，機器學習是個很好的「猜測」可能答案的工具！但是他們不會自己產生物理定律，資料也不會自動的精確呈現個別的邊界條件，都是很多物理條件混雜綜合的結果現象，想要從資料逆推出定理是很困難的！而且機器學習的目標也不是真的想研究出定理。

消極面，還是想告訴大家：並不是每個AI的問題都適合使用機器學習，事實是九成以上的問題都不適合使用ML！認真研究事實現象的成因，找出合理的判斷邏輯才能較快也較準確地達到AI的目標。積極面呢？即使你使用機器學習作出可用的AI產品，你也必須接受機率統計的不確定性，因為它們畢竟不是按照精準的科學原理推理出來的結果，尤其是當你想要精進優化辨識判斷能力時，他們的基礎並不像傳統科學一樣堅實穩固。

這些都是想採用機器學習解決實務問題者必須認真考慮的因素，也是想採購AI產品時大家必須破除的迷思！機器學習並不保證代表較高的品質與可靠度，事實上可能是正好相反！只有傳統科學實在無法作出堪用結果的混沌議題，才是機器學習產品可以發揮所長的場域。任何已經上線使用的機器學習產品也都期待著可靠的科學邏輯定理可以盡快跟上，讓產品的前途發展更為穩固的！

( 心情隨筆｜工作職場 )