智慧不會來自資料統計，而是對於事實深刻的理解！ - 鄉下老師

字體：小中大

智慧不會來自資料統計，而是對於事實深刻的理解！

2023/01/06 03:26:15瀏覽1642｜回應0｜推薦10

我正在實質指導我的RD寫作碩士論文，她讀的是南台科大資工所，我不是該校的正職教授，最多只能算該系的兼任教授，兼過幾次大學五專部的課而已。但因緣巧合，原任指導教授離職，其他老師因為工作量與研究屬性的關係也無法接管，就變成我必須加入「聯合」指導的狀況！我是教育部認可的大學(他校)資深副教授，當然有絕對合法的資格與能力做這件事！還不必支薪？沒人會說閒話的！

我與RD之間的師生合作都十幾年了！能夠指導她的研究當然比任何教授接管都更順暢！有趣的部分是在我的堅持主導之下，她改了一個原本其他教授都會覺得過於「簡單」的題目？就是她自己發明，也已經應用於我們公司影像辨識軟體很多年的特徵字模比對法！

如上圖所示，概念就是將傳統的「二值化」(黑白)字模改成「三值化」(黑紅綠)！紅點是筆劃軸心的特徵點，綠點是背景空白區的特徵點！紅點擊中資料圖的筆畫就加分，綠點擊中背景也加分！其他的黑點就當作不重要的資料直接忽略不處理了！數學概念上相當簡單，但是發揮的效果卻很驚人！讓字元辨識變得又快又準！

很微妙的！這個方法的實際資料處理量大減！原本每一個黑白點都需要與目標比對，現在只需要比對不到一半點數的紅與綠點！但是經過實驗證明，辨識正確率與穩定性卻大幅提高！我們近年的辨識軟體產品早就受用很大了！我其實可以刻意隱藏這個商業機密，但這是RD的發明，當然值得變成她的碩士論文！

我其實有七八個理由讓RD寫這個題目！經過這段時間的努力，研究所的老師們也看出我的觀點是對的！這絕對不是一個過於簡單的題目，此項發明的學術與商業價值都是很大的！如上表的數據顯示，它需要的運算時間僅是其他方法的1/3或以下！

為何可以達到這種驚人效能的原因？就讓RD在論文中好好說給大家聽了！在此我想點出的重點是：使用更多的資料，或更多的計算量，絕對不是AI合理的發展方向！好的「人工智慧」絕對不會來自大量資料的統計「學習」！那些愚蠢的努力只是瞎子摸象的浪費時間而已！動用更多GPU或邊緣運算來彌補機器學習派計算量太大的缺點，更是飲鴆止渴！完全抓錯重點！

這種特徵字模的發明就說明了我的觀點！我們是在與機器學習派做逆向思考！用更少的計算量來達到更好的結果！我們也真的達到目的了！這和機器學習強調大量資料的統計分析可以得到「智慧」？的概念是完全相反的！但是真的有用！就跟中國武術的點穴一樣，抓到重點攻擊就不必拳打腳踢，只要一根指頭點對位置就可以把敵人放倒了！

我不否認資料統計可以幫我們解決一些問題！但我認為那是面對一無所知的大量資料，還是想發展AI軟體，很不得已時才必須用的下下策！正常狀況一定是要真正深入理解問題，用已知的科學準確地解析與解決問題，才是AI科技發展的正途！我們公司一直走在這條康莊大道上！所有AI產品開發與影像辨識專案也都無往不利！我希望RD好好完成這篇論文，證明我們的理念經得起最嚴格的學術檢驗！

( 心情隨筆｜工作職場 )