對症下藥的影像辨識可以非常省錢還更精準！ - 鄉下老師

字體：小中大

對症下藥的影像辨識可以非常省錢還更精準！

2024/08/15 09:39:49瀏覽392｜回應0｜推薦7

洽談中的客戶說他們需要辨識這類零件的一些狀況，而且是立體空間上的一些狀況，光是用某一方向拍的2D照片可能無法辨識出某些問題，所以他提出可能必須做「3D」的辨識！我是海洋聲納探勘的專家，其實就是用各種聲納測距離，做海底地形3D立體測量的專家！這跟陸地上的測量專家使用光達(Light Detection And Ranging)做立體目標的測量原理是一樣的！

我當然知道他說3D測量的意思，還比他更熟悉相關工具的原理與資料處理技術。我立刻潑了他一盆冷水說：一般常用的光達都是用於探測較大的物體，如人、車或建築物，要測量小零件的光達預期不是一般性的產品，必然相當昂貴也較難做好精密的率定校正！除非迫不得已最好是不要輕易使用！資料後處理對我來說不是問題！問題是系統建置成本會太高，操作設定也會很耗時困難！

我的建議是：要知道3D物體中的某些關鍵資訊，用多個角度的2D照片也可以的！譬如一張側視圖就可以知道物體的厚度了！我們要辨識的零件重點通常不是全面的，所以不需要昂貴的光達做全面的3D測量。不像製作3D動畫時，必須有整個物體表面的所有3D立體資料點，才能擬真的讓模型動起來！

譬如上圖螺絲帽與底座之間有個焊接點，如果你想看清楚這個焊接結果是不是合乎正常標準？從上面拍俯視圖，加上兩個互相垂直的側視圖就可以得到需要的所有資訊了！只是三張2D影像都必須做辨識找出這個焊接點的位置與三個方向的2D形狀，再整合成它們成為焊接點的立體資訊即可！

簡單說，如果我們死腦筋，做任何辨識都是先取得所有完整的資訊，然後再想下一步，就像小孩子不知道長大之後要做甚麼事？就樣樣都學！其實是很浪費時間的！CNN就是這樣，動不動就全圖做Convolution，所以速度才會很慢，慢到必須呼叫GPU找NVIDIA幫忙的！我當老師時說過：任何高中成績及格想當軟體工程師的學生我都可以在一年內幫他達成目標！其實所有針對特定工作的職訓班都是這樣的！

所以像上面這種工作真的不能死腦筋只想著SOP該怎麼作？應該是要根據你想辨識的目標逆推你真正需要取得的關鍵資料是甚麼？設計出最精準有效的程序去取得必要的資料，對於辨識目的沒用的資料最好完全不去碰！影像辨識中有個ROI的概念就是這樣的！這樣就會讓辨識程序又快又好，成本也最低！

客戶聽了我的這段分析當然非常認同嘆服！距離我簽約接案的距離又更近了！其實這就是我為何總是可以設計出速度很快的辨識程式的中心思想！人生苦短，錢也總是不夠用！如何省錢是我們客家人的DNA！要省錢就是要有效率，用不到的東西就別買著好玩！或許這也是我唯一的影像辨識徒弟(RD)也是客家人的原因吧？哈哈！

( 心情隨筆｜工作職場 )