網路城邦
上一篇 回創作列表 下一篇  字體:
影像辨識必須見招拆招,不是你想的那樣,可以讓機器自己學會的!
2021/06/04 13:05:46瀏覽1083|回應0|推薦6

說到作影像辨識,我非常反感那些聲稱擁有AI影像辨識技術的人說:可以從資料中「學習」或「訓練」!事實是這些「專家」幾乎都沒做出過甚麼商業化的影像辨識產品!看看網路文章,玩玩工具軟體就開始大放厥詞了!實務上,我們要建立一個有效的辨識核心,一定就是見招拆招,該做甚麼就設計出針對性的演算法與程式碼,一步一步將我們要的東西從影像中抽取出來!這個過程根本不需要大量資料給電腦學習,解題過程也完全不像是個學習的過程!

上圖就是一個例子,我們想正確的辨識出一顆螺絲釘的形狀,利用類似演皮影戲的方式,從後方打光,目標變黑形狀也就凸顯出來了!但是我們同時希望螺絲釘是「平放」的!不然螺絲頭較大直接擺在平坦桌面就會一邊翹起來,長度也就不太精準了!

怎麼辦呢?那就將螺絲釘放在一個階梯邊緣,螺絲頭是懸空的,那就真的「擺平」了!但是階梯產生的陰影卻很明顯,二值化處理時還會跟螺絲主體連在一起,我們只要螺絲釘的輪廓,不要它帶著一條線啊?以我們處理的目標來說,階梯產生的線就是「雜訊」,必須拿掉!

但是以影像的角度來說,那條線卻是非常明顯的實質目標啊?好像沒有甚麼現成的濾波器可以直接濾掉它吧?怎麼辦呢?那就是要對症下藥,甚至說是開刀了!我必須想出一種合理的邏輯演算法,將階梯產生的線清掉,卻不會破壞我要的螺絲釘主體。其實也不難,就是找到圖上垂直延伸很長,事實上是最長的直線,沿著這條直線將寬度在一定範圍內的段落擦掉!

如果你執著於從影像辨識專書上找演算法,你一定會累到死還找不到完全適用的東西!像天真的小學生或中學生一樣思考,你反而很快就可以將問題解決了!我就是這樣做影像辨識研發的!重點是:它絕對不是一個通用於所有狀況的方法,卻是絕對可以準確解決我眼前問題的絕佳方案!

這種解決問題的方式很簡單很直觀,也非常有效,但我也說不出來它屬於哪一種影像處理技術?只是「將我不要的直線擦掉的方法」而已!我已經做過太多各式各樣特定目的的影像辨識專案,都是這樣見招拆招,一兩個月就可以做出非常高效率與高辨識率的辨識核心!我們不是甚麼AI網紅或玩家,我們真的是以影像辨識為主業的專業公司!靠這些技術活了七年了!

老實說,要我用機器學習或CNN的模式來做一樣的事情,我還真的不知道如何下手?即使真的套上公式SOP了,在辨識過程中碰到類似上面這種問題,我應該如何給資料讓程式去「學習」呢?我真的完全不會!你會嗎?

這很像那個:小學生請太空人用鉛筆寫字就好,不必使用「無重力鋼筆」的笑話!其實那些號稱AI影像辨識專家的人,絕對都沒我做過的影像辨識題目多。但是我的腦袋其實很像只會用鉛筆的小學生,我一定會先用我知道可以解題的方式去嘗試,絕對不會堅持非要用類神經網路或「深度」學習的技巧才能彰顯我的博士程度。

你會這麼堅持嗎?以做生意的立場來說,我希望同行都繼續那種堅持,絕對不用小學生都能看懂的技術做影像辨識,那樣太丟臉了!影像辨識可是高科技欸!非用CNNMLDL不可!大家都如此堅持專業,我就可以在影像辨識的研發市場穩穩繼續領先群雄了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=163500406