網路城邦
上一篇 回創作列表 下一篇  字體:
機器學習就是不知所以然,也不問其所以然的統計學!
2024/12/18 04:17:38瀏覽155|回應0|推薦1

國中數學/輕鬆搞懂統計資料處理 探索相對次數與累積次數

現在是AI已經瘋迷全世界的時代,各種AI應用正四處興起蓬勃發展之中,我的公司主要業務與我的日常工作影像辨識也被視為其中之一!甚至是AI應用中最複雜最重要的一個項目!所以我也是AI產業中的一份子,而且是實績成效相當好的廠商之一!不只是車牌辨識技術居於領先地位而已,各種影像辨識我們都做得很好的!

但是我卻常常撰文批評AI的迷思亂象,原因就是近年AI發展中,獲得最大最廣新成就的技術是機器學習!也因此許多人為了擴大既有的商業利益,刻意宣揚誤導「AI=機器學習」的錯誤觀念!事實是機器學習的基礎畢竟只是統計學而已,與需要精準分析資料獲得最高精度與可靠度的影像辨識是完全格格不入的!機器學習是有很有用處,但絕對不足以代表AI技術的全貌。

事實上不只是影像辨識,還有太多其他AI議題領域也都是不能完全依賴機器學習的!譬如醫療用的AI不只要準確,每個個案判斷也必須有百分之百的醫學知識邏輯為基礎,不然一旦發生醫療糾紛時,如何跟病人家屬與法官解釋?能說我的AI是用資料統計「猜答案」的嗎?這個說法在法律的觀點顯然不夠好,無法免責的!所以只知其然而不知其所以然的機器學習,也就是統計學,絕對不可能是AI的全部,連稱為AI的主軸技術都不夠格!AI的堅實基礎與核心應該還是精準可靠的科學!

上面這一則與AI似乎無關的報導其實可以幫助大多數人了解我的觀點!在我們這些老人讀國中的時候,對於統計的概念最多只是說明何謂概數、百分比與近似值而已,但是現在的國中課程會很清楚地介紹這些統計學的概念與名詞,就是因為機器學習技術的興起與重要性!

其實任何AI或傳統科學研究中,包括我現在做的影像辨識研究,我們都會不時使用到上述的統計學觀念,幫助我們對於既有資料有一個較宏觀且定量化的了解與掌握!真實世界很複雜,電腦數位時代來臨之後資料通常多到讓我們不知從哪裡著手?此時統計學計算出來的經驗值就很重要了!

但是資料統計也就是機器學習只是各種高科技高精度AI研究的開始,讓我們可以有個機率值,知道哪個方向的成功「機率」最高!就像很多家長都希望小孩讀醫科或讀理工科,因為以統計學的觀念,這種選擇以後可以賺錢生活安定有保障的機率值最高!但不是說考上醫學院或電機系就是人生事業會成功的保證!

如果你要事業生涯成功人生幸福美滿,這種決策方式只是一個開始,一種參考!凡事都相信機率統計最後就會變成一個極端迷信的人,忽視真正可靠的科學與自己的具體觀察與想法,整天只追求各種「最可能」獲得成功的明牌!即使運氣好買到樂透中了大獎,你也不知道如何複製成功經驗的正確邏輯!

我的影像辨識事業如果只依賴機器學習,就會很快碰到無法突破的辨識機率天花板!因為基本上是用舊資料統計「猜答案」的!為何如此?為何某些個案會出現例外?會與統計資料機率最高的答案有異?如果我不能進一步研究這些個案例外的真正科學原因,想出對症下藥的精準解決方式,我就不可能做出可靠的高辨識率產品!產品出門後難免發生辨識錯誤,如果連開發產品的RD都不知道原因,客戶的信心就崩盤了!

所以我始終強調:在影像辨識中機器學習(ML)、深度學習(DL)乃至類神經網路(CNN)都有其價值與地位,但絕對不是可靠的核心技術!這些以統計學為基底的技術,是極佳的探索資料的工具,可以是研究AI影像辨識的「起點」,但一定無法帶我們走到最高精度與可靠度的AI終點!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181523747