網路城邦
上一篇 回創作列表 下一篇   字體:
想做影像辨識需要甚麼數學基礎?
2024/12/25 04:15:34瀏覽189|回應0|推薦2

114學測數學/數A估更難 向量必考、數B難度適中

我現在是以影像辨識產品的研發為業,表現也相當不錯!不是只會寫論文的教授研究員而已,我做的車牌辨識產品到處都在用!內行人都知道,不管是用傳統的OCR,或是大家認為比較「新」的MLDLCNN等所謂的AI技術,都需要很多數學知識與理解分析能力!多數人讀書時最頭痛的科目通常就是數學!所以想要從事我的行業的年輕人或許會想知道重點在哪裡?

從上述的報導中,我已經看出新的數學考試重點方向已經有受到AI科技的影響與引導了!而且我認為對我的工作影響最大效益最高的向量幾何學已經受到相當大的重視!和我們老人家當年考試最大的差異,是題目都會跟真實狀況有更好的連結,不會只是抽象的要我們證明幾何圖案中某兩個角相等之類的!

如上的一個蠻困難的車牌影像辨識,關鍵步驟就是幾何學的操作應用!上例是我的新加坡版的解法,它同時會有字元排列傾斜與字元大小變形的問題,在此我是先旋轉整個車牌區域,再一一扶正個別的字元,最後將每個已接近「正直」的字元縮放到標準字模的大小進行那是甚麼字的比對!

但即使是一樣的題目也可以有很多不同的解法!我的台灣車牌、印尼車牌、港澳車牌與柬埔寨的車牌辨識核心其實變形校正的程序都不一樣的!每次研究新區域的車牌辨識,我都會趁機做一些新演算法的實驗與嘗試,通常也會發現更好的方法流程與技巧,如果評估具有整體的效益,就會回頭修改舊方法。

雖然我極少使用MLDLCNN等技術到我的產品之中,但不表示我沒有關注學習它們,據我的理解它們會用到很多矩陣計算(CNN),與較抽象的曲線高維的向量運算(MLDL),跟我說的幾何學還是密切相關的!所謂的張量(Tensor)就是比真實世界的向量更多維度的向量,用來處理更多變數的相關性運算用的!

以我的觀點,年輕人最重要的學習重點,應該是把自己的日常觀察經驗與數學,尤其是幾何學踏實緊密的建立連結!數學好不好的關鍵其實不應該是看你操作的數學式子的複雜抽象程度!而是看你面對真實的問題時,能不能跟你學過的數學立即產生連結互動!讓你的物理、數學與觀察經驗成為融會貫通的一體!

我讀書時數學成績其實不好,即使讀到大學微積分成績都還是班上的倒數的,只是勉強及格而已!但這只是表示我「操作」數學「遊戲」的能力不太傑出,就像玩籃球棒球電玩不太厲害而已,真的到球場上見真章時,那是另一回事!看到如上的真實案例時我就會有很多想法,也有能力具體導出數學公式,最終寫成程式處理它們!當年數學成績比我好的人都未必辦得到的!

所以我認為「基本動作」紮不紮實才是日後你能否精準使用數學解決問題,讓數學能力成為你的優勢的關鍵!別人怎麼看?甚至考試成績是否頂尖?都不太重要!而是你必須很在意:你真的理解數學了嗎?你讀的數學有真的整合成你的直覺與常識的一部份了嗎?

我曾經辭退過一位台大光電所影像辨識專長碩士的員工,就是因為他知道的數學確實很多,但是碰到真實問題時總是找不到最好的簡單合理的解法?努力磨合了一整年之後,我知道我幫不了他了!他的數學概念與他的直覺常識相距太遙遠了!要辭退他時經過一番深入懇談,他臨行前的最後一句話值得年輕人參考省思:原來影像辨識可以用直覺與常識來做!我以為理所當然的事,卻是台大電機碩士高材生難以克服的魔障?

真實世界的問題當然是按照我們對事實的理解掌握去處理,讀不讀書最大的差異就是:如果不讀書你只有直覺與常識,沒有幾千年人類文明累積的「知識」!既然讀了書就是必須要將知識常識甚至直覺充分整合!如果你的知識是無根的!與你的直覺、經驗與常識是獨立分離的!讀再多書都沒用的!浪費生命而已!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181556501