一個例子告訴你在影像辨識中幾何學很重要！ - 鄉下老師

字體：小中大

一個例子告訴你在影像辨識中幾何學很重要！

2026/03/16 11:17:09瀏覽83｜回應0｜推薦1

每次有人問我：想做好做影像辨識，需要甚麼學科基礎？我都會強調必須先把幾何學學好！說穿了，影像辨識就是要在影像中辨識各種「形狀」的目標！而處理各種「形狀」的數學就是幾何學了！譬如我現在在影像辨識研發上最傑出的成就，就是可以辨識因為拍攝角度不一產生的各種歪斜變形的車牌！使用的數學技巧就是來自幾何學！

像上面的鑽頭辨識也是一個好例子！我的客戶應該是想知道弧形刀刃的彎曲程度吧？以A與C點為基準線，他們想知道離此直線垂直距離最遠的一點B！如果你還記得高中學過的幾何學，就會知道這是在計算B點與AC直線的垂直距離，如果你要考大學理工自然組這就是一個應該要會做的基本題型了！我的厲害之處就是十幾歲時學會的這些數學，現在都65歲了！還是記得清清楚楚！就是：

AC向量與BC向量的外積=(AC長度) X (BC長度) X (SIN(角BCA))

B到AC線的垂直距離就是：(BC長度) X (SIN(角BCA))=AC向量與BC向量的外積/(AC長度)

點到為止，有進入狀況的人應該都看懂了，我可以用這些關係式計算那個弧形刀刃上的每一點與AC直線的垂直距離，客戶需要的B點就可以順利找到了！所以對我來說，高中的幾何學不只是為了考上大學使用，我現在真的有靠這些知識討生活了！當然數學通了還需要程式設計的技術將這些數學公式實作出來！

這種數學解析能力其實在讀書時沒有很難，我的建中同學應該都會考100分的！但是卻很少人可以融會貫通真的在多年之後需要用時可以想起來，還熟練到可以自己按照數學觀念寫成程式？所以資訊領域才會需要很多數學函式庫！如OpenCV或MatLab之類的！但是我就完全不需要這些工具函式庫！還可以比使用這些函式庫的人更快更精準的完成工作！

回到老話題，各位覺得這種處理資料的智慧，可以用深度學習(DL)從大量資料中經過大量運算就自己「學會」嗎？如果真的能學會，需要多少資料與計算量才能成功呢？反過來說，如果我們為了辨識影像需要「學會」的這種智慧，其實在自己讀書時就已經是熟悉的知識了呢？我們還要找很多資料用昂貴的GPU電腦重頭再學一次嗎？

事實是ML與DL都是效率很低極為耗費資源的AI技術，如果你真的有讀過書，就應該盡量善用已經學會的知識，不要迷信一定要用那些XX學習！你的影像辨識工作就會像我一樣非常快速省錢而且做得更好了！

( 心情隨筆｜工作職場 )