影像辨識必須見招拆招，不是你想的那樣，可以讓機器自己學會的！ - 鄉下老師

字體：小中大

影像辨識必須見招拆招，不是你想的那樣，可以讓機器自己學會的！

2021/06/04 13:05:46瀏覽1083｜回應0｜推薦6

說到作影像辨識，我非常反感那些聲稱擁有AI影像辨識技術的人說：可以從資料中「學習」或「訓練」！事實是這些「專家」幾乎都沒做出過甚麼商業化的影像辨識產品！看看網路文章，玩玩工具軟體就開始大放厥詞了！實務上，我們要建立一個有效的辨識核心，一定就是見招拆招，該做甚麼就設計出針對性的演算法與程式碼，一步一步將我們要的東西從影像中抽取出來！這個過程根本不需要大量資料給電腦學習，解題過程也完全不像是個學習的過程！

上圖就是一個例子，我們想正確的辨識出一顆螺絲釘的形狀，利用類似演皮影戲的方式，從後方打光，目標變黑形狀也就凸顯出來了！但是我們同時希望螺絲釘是「平放」的！不然螺絲頭較大直接擺在平坦桌面就會一邊翹起來，長度也就不太精準了！

怎麼辦呢？那就將螺絲釘放在一個階梯邊緣，螺絲頭是懸空的，那就真的「擺平」了！但是階梯產生的陰影卻很明顯，二值化處理時還會跟螺絲主體連在一起，我們只要螺絲釘的輪廓，不要它帶著一條線啊？以我們處理的目標來說，階梯產生的線就是「雜訊」，必須拿掉！

但是以影像的角度來說，那條線卻是非常明顯的實質目標啊？好像沒有甚麼現成的濾波器可以直接濾掉它吧？怎麼辦呢？那就是要對症下藥，甚至說是開刀了！我必須想出一種合理的邏輯演算法，將階梯產生的線清掉，卻不會破壞我要的螺絲釘主體。其實也不難，就是找到圖上垂直延伸很長，事實上是最長的直線，沿著這條直線將寬度在一定範圍內的段落擦掉！

如果你執著於從影像辨識專書上找演算法，你一定會累到死還找不到完全適用的東西！像天真的小學生或中學生一樣思考，你反而很快就可以將問題解決了！我就是這樣做影像辨識研發的！重點是：它絕對不是一個通用於所有狀況的方法，卻是絕對可以準確解決我眼前問題的絕佳方案！

這種解決問題的方式很簡單很直觀，也非常有效，但我也說不出來它屬於哪一種影像處理技術？只是「將我不要的直線擦掉的方法」而已！我已經做過太多各式各樣特定目的的影像辨識專案，都是這樣見招拆招，一兩個月就可以做出非常高效率與高辨識率的辨識核心！我們不是甚麼AI網紅或玩家，我們真的是以影像辨識為主業的專業公司！靠這些技術活了七年了！

老實說，要我用機器學習或CNN的模式來做一樣的事情，我還真的不知道如何下手？即使真的套上公式SOP了，在辨識過程中碰到類似上面這種問題，我應該如何給資料讓程式去「學習」呢？我真的完全不會！你會嗎？

這很像那個：小學生請太空人用鉛筆寫字就好，不必使用「無重力鋼筆」的笑話！其實那些號稱AI影像辨識專家的人，絕對都沒我做過的影像辨識題目多。但是我的腦袋其實很像只會用鉛筆的小學生，我一定會先用我知道可以解題的方式去嘗試，絕對不會堅持非要用類神經網路或「深度」學習的技巧才能彰顯我的博士程度。

你會這麼堅持嗎？以做生意的立場來說，我希望同行都繼續那種堅持，絕對不用小學生都能看懂的技術做影像辨識，那樣太丟臉了！影像辨識可是高科技欸！非用CNN、ML、DL不可！大家都如此堅持專業，我就可以在影像辨識的研發市場穩穩繼續領先群雄了！

( 心情隨筆｜工作職場 )