90%以上的影像辨識，不需要也不應該使用機器學習！ - 鄉下老師

字體：小中大

90%以上的影像辨識，不需要也不應該使用機器學習！

2020/09/06 04:49:48瀏覽1332｜回應0｜推薦5

如果你很認真想學會做影像辨識，不管是到正規學校進修，或是到學費很貴的補習班，你會看到的課程內容大概都是這個模樣！我自己是一個已經很成功地在做專業影像辨識產品研發的公司，在台灣，敢說自己公司「只做」影像辨識產品核心研發的公司，應該只此一家！但是我看這些課程內容時，卻很像在看來自外星的科技？所以這幾年來，我一直持續認真理解這些我原本不熟悉的科技。

我自己的影像辨識學理基礎很簡單，基本上都是三十年前就有的書上介紹的影像處理概念，灰階、二值化、邊緣強化、影像切割或影像分類等等。其他就是依據需要辨識的影像特性去設計「客製化」的部分，辨識綠葉就是凸顯強化像是葉子的區域然後設法切割，辨識車牌就依據車牌與一般背景的特徵差異，想辦法找到車牌。

從我七八年前開始研發商業化影像辨識產品之初，就已經有機器學習的聲浪了，近幾年更是震耳欲聾！讓所有人都認為做影像辨識「必須」導入機器學習深度學習？你要進入這個產業的「前提」，好像就必須學會上面這種課表？但是這些課表中有九成的內容我沒正式學過，也完全不曾用於我的產品研發，因為我始終沒有這個需要，如果用明確已知的知識技術就可以解決我的問題，我為何要去使用並不那麼明確的統計學呢？

那麼我是外星人嗎？為什麼大家都說非學不可的東西，我不但沒學會，也沒使用，就可以比那些「教影像辨識」的老師做出更多他們宣稱「學了我的東西才能做」的影像辨識產品呢？那些已經讀完這些課程畢業多年的學生散布於各大公司從事影像辨識研究，包括我最成熟的產品車牌辨識在內，但是我們在市場上還是鮮少看到以這些技術生產的暢銷產品。

為什麼會這樣？我自己理解到的答案，第一是沒有必要！那些技術太強調「通則」，但實際上絕大多數我們需要的影像辨識都有明確單純的目標，我們不需要辨識分類好「所有」的物體目標，只要辨識該產品設定要辨識的特定目標即可，重點是辨識率要高，而不是辨識能力廣泛。

一般人總會被深奧的數學所震懾迷惑，但是我的認知是：任何數學演算都不能無中生有！同樣的事實基礎資料，在此就是數位影像中的原始資料，你做越多越複雜的運算只會讓資訊遺失(或扭曲)越多！並不會因此出現新的事實。所以那些以統計學為基礎的演算法，並不會讓需要高辨識率的軟體更準，直接針對辨識目標特性設計的辨識演算法，才能原汁原味最精準使用原始資料達到最高辨識率！

簡單說，以我目前的理解，這些複雜的統計學或高維的幾何學演算技術，對於90%以上，需要高辨識率辨識特定目標的市場辨識軟體需求，其實不但沒有必要，還會拖延研發時間，因為數學複雜，套用與實驗的時間增加，最終不但無法提高辨識率，還會因為過度的演算而遺失部分資料，反而降低辨識率！

我們是不是需要繁文縟節疊床架屋的複雜工具？應該視需求而定！如果並不需要，如果不會提高品質，我們為何「一定」要導入這些技術？只為了維護AI的虛偽形象嗎？我知道，也相信，這些技術在某些性質的議題上必然很有用處，不然不會造成今天的風潮！但是我也很明確知道：九成以上的影像辨識產品研發並不需要它們，刻意導入只會增加成本與研發難度，也不會得到最佳辨識率！

簡單說，上這種課程，你會花費90%的時間學習只有10%機會需要用到的技術。你真正有90%機會會遇到，而且可以使用非機器學習技術解決的問題，你需要的知識訓練在這種課程中則是最不重要，常會直接被省略的章節！我還沒學會那些課程的大部分，已經用影像辨識產品研發創業成功就是明證！

( 心情隨筆｜工作職場 )