用物理與數學建構AI影像辨識當然比機器學習更好！ - 鄉下老師

字體：小中大

用物理與數學建構AI影像辨識當然比機器學習更好！

2024/05/01 04:47:04瀏覽793｜回應0｜推薦8

我們公司以優秀的車牌辨識產品起家，但是從未自我設限，各種影像辨識項目都會涉獵，使用的技術也一向是「海納百川，不捐細流」，任何有利於我們辨識產品的技術都會積極採用。雖然目前以ML、DL與CNN為核心的所謂AI技術，似乎已經占據影像辨識領域的主流位置？但我們不會盲從，堅持繼續走自己認為正確且已有成效的路，也持續獲得比那些AI團隊更好的成果！

我們與使用機器學習技術的AI團隊最大的本質差異，就是我們認為AI的產生應該來自清晰的物理現象分析與理解，而非來自大量資料的「學習」！學術性的說法就是：我們是以「科學」的角度研究應該如何完成最精準有效的辨識演算法！機器學習則是以「資料統計」為核心，認為只要資料夠多就可以經過排列組合與嘗試錯誤產生最有「智慧」的成果！(？)

一個鮮明的例子就是我們目前進行中的工地揚塵辨識專案，揚塵可以說是整個影像之中最「模糊」的目標，跟辨識車牌或人員車輛等實體目標是很不一樣的！目標越簡單明確需要用於「學習」的資料就越少，越模糊就需要越多！所以如果你堅持要讓「機器」「學會」如何辨識揚塵？而且不能讓機器學物理，只能用大量資料學會，那就需要超級巨大的資料量，結果還未必很精準！

老實說，像我們這種小公司是「沒資格」使用機器學習的，因為大量資料的蒐集與標記就是極高的成本，我們付不起的！要用機器學習的技術接案，就必須先借貸集資買資料與AI研發相關的電腦軟硬體，案子成功利潤也很低，研發失敗就會負債跑路了！但我們公司的存在證明可以不必用機器學習也能作影像辨識存活的！ML、DL與CNN都只是選項，必然是最昂貴的選項！卻未必是成效最好的選項！

而且客戶未必可以提供你需要的夠多的揚塵事件資料！即使錄影一整天揚塵事件也不過幾次，就像科技執法中要讓機器學會辨識某路口違規轉彎的車輛，你要收集至少幾百次違規事件的影像來訓練你的Model，這很容易嗎？可能要等上好幾個月，甚至好幾年！如果你需要幾百次的揚塵事件來「學習」，你需要收集處理多少G的影像資料？你要等待多久才有足夠資料？客戶能配合嗎？願意等那麼久嗎？

但是如上圖我們從物理事件分析的角度切入，就不需要大量資料，只需要具有代表性的幾個揚塵事件影片的片段，很快就可以建立很穩定精確的辨識核心了！首先是簡單的做動態偵測，用前後影像的變化偵測到某些區塊跟剛剛不一樣了！這些區塊可能是揚塵，但更可能只是工地作業中人員、車輛或機具的移動！

我們只需要找到揚塵與其它移動目標的物理性質差異，分辨擾動區是不是揚塵即可！在此很明確的物理事實是：揚塵有透明度，實心移動目標沒有！大卡車經過會把原來的背景完全遮住，揚塵與煙霧就不會！所以只要研發出可以判斷擾動區概略透明度的演算法就可以正確分辨是不是揚塵了！之前採用CNN等技術製作的系統就是誤報率太高讓客戶不滿意才找我們的！有了可靠的目標特徵辨別根據誤報機率當然會大幅降低。

我相信舊系統容易誤報也不是CNN或機器學習本身的錯！而是他們這種方法如果無法達到理論上需要的巨量資料，做出理想的訓練，就是無法穩定辨識的！可是如前所述，他們需要的資料通常是等不到等不齊的！只能硬著頭皮勉強出貨！但是如果採用我們的研發理念根本就不需要太多資料！所有的事件都是在地球上發生的，物理定律都不會變，誤報率當然就會很低了！

其實用科學為基礎來研發AI優於使用機器學習是再明顯不過的事實了！機器學習的優勢是在我們對目標所知極少，只有大量資料卻無法充分理解資料成因時才最有用！如果我們已經對目標的物理現象事實很了解了呢？那就根本不需要，也不應該採用機器學習的！譬如不必脫了褲子再放屁一樣！

( 心情隨筆｜工作職場 )