網路城邦
上一篇 回創作列表 下一篇   字體:
用自動去背辨識紙箱?不錯的想法,但我們必須做得更好!
2026/01/23 11:12:57瀏覽211|回應0|推薦8

介紹最近學會的「自動去背P圖」演算法: GrabCut

昨天與委託我們做紙箱體積辨識的客戶開會報告我們的研發進度,雙方交流中,得知他們之前的自行開發版本中,很仰賴類似如上介紹的去背演算法,所以今天就花了一些時間上網搜尋閱讀一下相關資訊。很有趣的,部分概念居然和我的辨識數位地形資料的博士論文有點相似?但是當然他們的邏輯更複雜,用到更多機率統計的數學!有興趣的讀者可以看看上面的連結!

但如果用這類技術就可以完美解決紙箱辨識的問題,就不會需要找我們來深入研究了!如上圖所示,右邊較單純的場景當然用網路上可找到的去背公開技術應該是毫無問題!但目標前景與背景如果複雜到如左邊的狀況呢?常常就是時有時無,或是出現錯誤答案了!

這些去背的演算法真的很厲害很神奇!我也是邊看邊鼓掌的!但它們是以不特定目標開發的通用演算法,沒有考慮如果是針對特定已知性質特徵的目標物時可以如何做得更好、更快、更合理?所以才會需要專業人員開發特定使用目的的影像辨識軟體!很像ChapGPT可以快速產生堪用的文稿,但是想要好的作品還是必須專業人士認真撰寫的!怕AI取代你的工作嗎?你必須真的比AI做得更好!

如果要循著他們已開發的成果繼續前進,應該就是試著調整去背功能,讓它們能更針對紙箱目標的特性將切割去背的動作得更準確!譬如紙箱的邊緣應該是相當直的線段,加上這個限制條件就能避免很多雜訊干擾,也簡化程序加快速度了!

但是去背演算法並不是我們擅長熟知的技術,要在那個基礎上調整精進並不容易,也未必一定會有較佳結果!而且去背是考慮全圖特徵相關性的演算法,如果一開始就做這件事,就已經浪費太多計算資源了!所以我們並未把去背當作一個必要程序!就是直接跳過全圖前景與背景特徵分類的複雜演算,直接嘗試找紙箱的軸線與輪廓的!

我們目前的經驗是這些直線線段部分很清晰,部分很模糊,雜訊干擾造成誤認的情況也很多!但是當我們加入很多獨立於影像之外的物理知識原理時,大部分的辨識困難都會有合理的答案,我們需要的只是更多時間將這些資訊量化與整合分析!目前看起來狀況(辨識率)是越來越好的!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=185672070