網路城邦
上一篇 回創作列表 下一篇  字體:
智慧不會來自資料統計,而是對於事實深刻的理解!
2023/01/06 03:26:15瀏覽1642|回應0|推薦10

我正在實質指導我的RD寫作碩士論文,她讀的是南台科大資工所,我不是該校的正職教授,最多只能算該系的兼任教授,兼過幾次大學五專部的課而已。但因緣巧合,原任指導教授離職,其他老師因為工作量與研究屬性的關係也無法接管,就變成我必須加入「聯合」指導的狀況!我是教育部認可的大學(他校)資深副教授,當然有絕對合法的資格與能力做這件事!還不必支薪?沒人會說閒話的!

我與RD之間的師生合作都十幾年了!能夠指導她的研究當然比任何教授接管都更順暢!有趣的部分是在我的堅持主導之下,她改了一個原本其他教授都會覺得過於「簡單」的題目?就是她自己發明,也已經應用於我們公司影像辨識軟體很多年的特徵字模比對法!

如上圖所示,概念就是將傳統的「二值化」(黑白)字模改成「三值化」(黑紅綠)!紅點是筆劃軸心的特徵點,綠點是背景空白區的特徵點!紅點擊中資料圖的筆畫就加分,綠點擊中背景也加分!其他的黑點就當作不重要的資料直接忽略不處理了!數學概念上相當簡單,但是發揮的效果卻很驚人!讓字元辨識變得又快又準!

很微妙的!這個方法的實際資料處理量大減!原本每一個黑白點都需要與目標比對,現在只需要比對不到一半點數的紅與綠點!但是經過實驗證明,辨識正確率與穩定性卻大幅提高!我們近年的辨識軟體產品早就受用很大了!我其實可以刻意隱藏這個商業機密,但這是RD的發明,當然值得變成她的碩士論文!

我其實有七八個理由讓RD寫這個題目!經過這段時間的努力,研究所的老師們也看出我的觀點是對的!這絕對不是一個過於簡單的題目,此項發明的學術與商業價值都是很大的!如上表的數據顯示,它需要的運算時間僅是其他方法的1/3或以下!

為何可以達到這種驚人效能的原因?就讓RD在論文中好好說給大家聽了!在此我想點出的重點是:使用更多的資料,或更多的計算量,絕對不是AI合理的發展方向!好的「人工智慧」絕對不會來自大量資料的統計「學習」!那些愚蠢的努力只是瞎子摸象的浪費時間而已!動用更多GPU或邊緣運算來彌補機器學習派計算量太大的缺點,更是飲鴆止渴!完全抓錯重點!

這種特徵字模的發明就說明了我的觀點!我們是在與機器學習派做逆向思考!用更少的計算量來達到更好的結果!我們也真的達到目的了!這和機器學習強調大量資料的統計分析可以得到「智慧」?的概念是完全相反的!但是真的有用!就跟中國武術的點穴一樣,抓到重點攻擊就不必拳打腳踢,只要一根指頭點對位置就可以把敵人放倒了!

我不否認資料統計可以幫我們解決一些問題!但我認為那是面對一無所知的大量資料,還是想發展AI軟體,很不得已時才必須用的下下策!正常狀況一定是要真正深入理解問題,用已知的科學準確地解析與解決問題,才是AI科技發展的正途!我們公司一直走在這條康莊大道上!所有AI產品開發與影像辨識專案也都無往不利!我希望RD好好完成這篇論文,證明我們的理念經得起最嚴格的學術檢驗

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=178036253