字體:小 中 大 | |
|
|
2024/10/31 16:11:11瀏覽400|回應0|推薦9 | |
我常說大部分的影像辨識,如車牌辨識、人臉辨識、指紋辨識、考卷辨識或儀表辨識等需求,都要求高精確度到99%以上,所以以統計學為基礎的機器學習完全不適合用來開發這些影像辨識!因為機率統計學基本上就不是追求完美精確的技術,不管用多少資料訓練出來的模式,都很難面面俱到精準到99%以上。 如果需要辨識的目標很簡單清楚當然用甚麼技術都一樣,但是機器學習模式的開發成本高,碰到簡單的案例當然還是「不要」用機器學習比較好!所以實務上適合用機器學習技術開發的影像辨識議題很少,具體說就是:目標模糊環境複雜而且辨識率要求不太高的議題。如上的採果辨識就是其中之一! 果農們要採水果時,雖然還是希望一個都不能少,但如果可以達到九成上下的正確率,又確實可以節省人力,就可以接受了!就是每一百顆漏掉五六顆甚至七八顆都還好的!人工採摘如果趕時間爭時效的話也差不多是這個成功率的!留幾顆給猴子小鳥蟲子吃是很平常的!果農不會因此對AI廠商抓狂的! 如果我就是堅持不用機器學習,要用傳統的影像辨識技術,以顏色形狀等區塊特徵辨識藏在枝葉之中的成熟水果,當然也是可以的!但是因為辨識的複雜度較高,製作成本與時間就會跟使用機器學習不相上下,還特別需要高技術且傷腦筋,那就不如使用機器學習的統計模式讓電腦去忙了! 所以我的公司碰到類似這種案子,通常就不會接了!讓那麼多聲稱機器學習很厲害的公司去做就好了!因為用我們的傳統方式做起來很辛苦耗時,成效也不會比機器學習作出來的好上多少!吃力不討好,利潤也不會高,在商言商嘛!通常就會婉拒了!如果硬是要做辨識率還是會比機器學習更高的!手寫字的辨識情況也很類似,我們已經推辭過很多次了!不是不會做,是經濟效益不夠高的考量結果。 基本上機器學習模式就是不管物理細節,累積大量模糊的經驗,不求每個案例的辨識過程都很完美合理,只求建立一個通用的模式可以讓整體的正確辨識數提高!也就是不必根據個案建立完美的演算法適合每一個不同的案例,只是讓電腦用大量資料統計出一個機率最高的「猜題」模式的意思。 我常說AI會騙人的意思就是:這種統計模式絕對不可能達到傳統影像辨識根據物理與科學為基礎,完整分析每個案例的屬性變因,設計出合理演算法的傳統模式能辨識的準確度!也就是說機器學習是一種便宜行事的機制,但實際做起來因為需要大量資料與大量電腦運算,開發成本絕對不「便宜」! 所以即使是複雜的影像辨識也不是非用機器學習不可!只是不用機器學習的話,影像辨識的技術門檻對於大多數工程師來說就太高了!大家風靡這種技術的真正原因是技術門檻因此變得很低,幾乎任何軟體工程師只要有足夠資料就可以照本宣科做出差不多堪用的成果!甚至不必修過影像辨識原理的課程都行的! 所以機器學習絕對不是可以達到較高的辨識率,只是技術門檻較低讓大多數不太懂影像辨識的人也能加減做而已!如果因為看到大家一窩蜂的使用機器學習就誤以為他們是「較好較準」的先進影像辨識技術?那就錯得離譜了!但那些宣傳AI的人就是希望大家這麼相信的!所以我才會說他們是騙人的! |
|
( 心情隨筆|工作職場 ) |