網路城邦
上一篇 回創作列表 下一篇   字體:
一個例子告訴你在影像辨識中幾何學很重要!
2026/03/16 11:17:09瀏覽83|回應0|推薦1

每次有人問我:想做好做影像辨識,需要甚麼學科基礎?我都會強調必須先把幾何學學好!說穿了,影像辨識就是要在影像中辨識各種「形狀」的目標!而處理各種「形狀」的數學就是幾何學了!譬如我現在在影像辨識研發上最傑出的成就,就是可以辨識因為拍攝角度不一產生的各種歪斜變形的車牌!使用的數學技巧就是來自幾何學!

像上面的鑽頭辨識也是一個好例子!我的客戶應該是想知道弧形刀刃的彎曲程度吧?以AC點為基準線,他們想知道離此直線垂直距離最遠的一點B!如果你還記得高中學過的幾何學,就會知道這是在計算B點與AC直線的垂直距離,如果你要考大學理工自然組這就是一個應該要會做的基本題型了!我的厲害之處就是十幾歲時學會的這些數學,現在都65歲了!還是記得清清楚楚!就是:

AC向量與BC向量的外積=(AC長度) X (BC長度) X (SIN(BCA))

BAC線的垂直距離就是:(BC長度) X (SIN(BCA))=AC向量與BC向量的外積/(AC長度)

點到為止,有進入狀況的人應該都看懂了,我可以用這些關係式計算那個弧形刀刃上的每一點與AC直線的垂直距離,客戶需要的B點就可以順利找到了!所以對我來說,高中的幾何學不只是為了考上大學使用,我現在真的有靠這些知識討生活了!當然數學通了還需要程式設計的技術將這些數學公式實作出來!

這種數學解析能力其實在讀書時沒有很難,我的建中同學應該都會考100分的!但是卻很少人可以融會貫通真的在多年之後需要用時可以想起來,還熟練到可以自己按照數學觀念寫成程式?所以資訊領域才會需要很多數學函式庫!如OpenCVMatLab之類的!但是我就完全不需要這些工具函式庫!還可以比使用這些函式庫的人更快更精準的完成工作!

回到老話題,各位覺得這種處理資料的智慧,可以用深度學習(DL)從大量資料中經過大量運算就自己「學會」嗎?如果真的能學會,需要多少資料與計算量才能成功呢?反過來說,如果我們為了辨識影像需要「學會」的這種智慧,其實在自己讀書時就已經是熟悉的知識了呢?我們還要找很多資料用昂貴的GPU電腦重頭再學一次嗎?

事實是MLDL都是效率很低極為耗費資源的AI技術,如果你真的有讀過書,就應該盡量善用已經學會的知識,不要迷信一定要用那些XX學習!你的影像辨識工作就會像我一樣非常快速省錢而且做得更好了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=187349983