其實我的博士論文裡面就有CNN了！ - 鄉下老師

字體：小中大

其實我的博士論文裡面就有CNN了！

2024/04/26 07:34:15瀏覽699｜回應0｜推薦6

張逸中，1997，二維地球物理資料之自動化線型描繪

國立台灣大學海洋研究所博士論文

表面上看起來我是海洋學博士的學歷，不但與甚麼AI影像辨識八竿子打不著，連資訊領域都沾不到邊，現在居然敢開軟體公司，專作影像辨識核心開發？真是奇葩了！但事出必有因，真實狀況並沒有這麼離譜！因為我的博士論文就是一個非常類似影像辨識演算法的新發明了！我的主要目標是辨識地形圖上的線型特徵，像是山脊或山谷的軸線等等。以現在流行的說法來描述，你也可以將我的博士論文視為地形圖上的AI辨識研究！

在我們地質學的概念上，山系或水系都應該是有連續性的！即使山頂稜線上有個小平台或一個鞍部山口我們還是會一條線畫過去說它是山脊的一部份，不會說山脈在此斷掉了！或是到了河谷的平坦地區，即使是一個寬寬的平地，我們也不會貿然說河流在此結束了，沒有繼續下坡不表示河水就不會流動了，它總是會繼續流到出海的。我的博士論文就是要發明一種合乎地質專家認知的山脈與水系的樹枝狀線型描繪演算法！這不就是現在各領域的AI想做的事情嗎？我應該可以拿到AI政策性發展補助的！

最簡單的山或谷的數學表示就是局部高點(Local high)與局部低點(Local low)，但尺度太小只會看到不連續的一堆雜訊，我當時就在想地質專家們腦袋裡是如何判斷地形連續性的？答案就是類似CNN(類神經網路)演算法中的矩陣卷積(Convolution)運算了！我在研究所的資料處理課也學過一維的Convolution計算的！有一定尺度大小的特徵矩陣去掃描原始資料，就可以看到較模糊較大的宏觀尺度的目標了！很像在複雜背景的照片中用CNN運算產生的特徵加權值找到貓或狗！

事實上我設計的特徵矩陣比一般CNN用的更複雜！如上圖是包含了多方向的考慮，也就是一次掃描就會得到多方向的特徵權重！老實說，當時我對於這類的演算法別人是怎麼作的？還一無所知！完全以自己所知的有限數學與物理概念去思考建構的！所以當時所內數學最好的喬凌雲教授看完我的論文後有點哭笑不得，說我最大的優勢是：根本是個大外行！意思是我的研究天馬行空無所顧忌甚麼都敢亂來，居然也做出極好的效果？所以那時很多人都說我比留美博士更美式作風！好聽的說法就是：很有創意啦！

上圖就是我用我自創的類似「CNN」的特徵矩陣掃描出來的台灣最高點分水嶺附近的山脊特徵權重圖！樹枝狀的山系分布已經很明顯了，再用我發明的另一種演算法，在盡量保持連續性的前提下，畫出上圖的高點軸線，就變成下圖的山系軸線圖了！就是將地質學家直觀判斷手繪山系圖的動作自動化了！

古人說的「學苟知本，六經皆我註腳」就是這個意思！即使我自稱不愛用ML、DL與CNN等技術，但是面對一樣的物理問題，任何人想出來的解法，總是會有重疊相通的部分，我批評那些AI的重點不是他們不對！而是他們不願意想清楚演算法的物理意義，只想偷懶讓電腦自己摸索產生最佳解答！結果在影像辨識這個領域內非常沒有效率，浪費太多資源，效果卻還不如傳統的影像辨識技術。

大家不必被AI的神奇效果或宣傳迷惑了！所有的科學與技術都是有延續性相關性的！最終能產生正確效果的演算法也都必然合乎常識，甚至合乎直覺！電腦AI專家們玩的複雜數學之中絕對沒有大神的！也應該距離你的常識認知沒有很遠！對於完全無法理解的說法你只應該高度懷疑，絕對不必迷信！這樣才能讓AI的發展更有效率更健康！也可以杜絕很多AI詐騙！

( 心情隨筆｜工作職場 )