網路城邦
上一篇 回創作列表 下一篇   字體:
誰說影像辨識要用GPU才夠快?我就不用,速度還更快!
2024/09/28 09:38:24瀏覽678|回應0|推薦10

兩百萬畫素的影像,豐富且複雜的場景,字元高僅15個畫素的貨櫃碼目標,我的軟體可以只用119毫秒就辨識完成!而且是在一般規格的電腦上就可以執行的,完全跟任何GPU支援的特殊運算模式無關,所以不必買特殊規格的顯示卡或晶片,也不必安裝CUDA相關的軟體,使用者可以省很大

現在一說到影像辨識就會扯上GPU?好像不用GPU就不能作影像辨識?不用GPU就無法快得起來?不用GPU就落伍了?其實這都是被AI詐騙集團刻意炒作出來的錯誤迷思!事實根本不是這樣的!現在一般規格電腦的CPU與好幾G的記憶體(RAM)要應付百萬畫素等級的影像辨識根本就綽綽有餘!完全不必用到GPU就可以將影像辨識做得很好了!

聽不懂嗎?我可以說得清楚一點:一張未壓縮的200萬畫素全彩影像,200萬就是2M,每一個畫素需要RGB三個byte儲存,乘以3就是6M1G=1000M,你的電腦記憶體即使只有4G,把6M的影像丟進去,6/4000是多小的比例?即使運算過程中用到五六倍的過渡處理陣列,30/4000也不到百分之一,根本就不痛不癢的!加上CPU多半有很多個核心,正常演算法的計算量根本就用不完,何須特意呼叫計算能力低很多的GPU呢?

他們的合理說法是這樣計算會「比較快」?真的嗎?大家認真想想:分散運算就是將完整的工作切割分工給計算能力較低階的處理器計算,但影像辨識必須經過很多個步驟,切割分工之後就必須再次彙整結果才能進行下一步,好像旅行團每到一個景點就必須大費周章地來一次解散各自活動之後再集合上車往下一站!資料切割移轉整合的次數流量大增,其實一定是比較沒效率的

很像一件軟體開發的工作交給一個能幹的RD,一個人很快就可以做好!不需要反覆開會討論如何分工與整合各模組開發成果等等。但是你堅持大家都要有飯吃,硬是分給多個只有初級能力的菜鳥軟體工程師「分工合作」?結果是會怎麼樣?當然是曠日廢時還做得更糟糕了!所以我的公司只有兩個人,每個專案都是一人獨自擔綱,不會找七八個技術平平的人進來亂,執行效就非常高,一周也只需要例行開會一次了解彼此的進度。

一個百萬畫素影像原本只要一個演算流程載入CPU,全部算好再輸出結果就好了!使用GPU就必須在過程中分分合合,一個影像要切成幾百幾千塊送進GPU做一次性簡單的矩陣運算,算出來的結果再匯回CPU做下一步處理,這樣反覆分割匯整很多次才能完成一個完整有意義的全圖辨識工作,這樣真的會「比較快」嗎?除非你用的是蠢笨到極點的爛演算法,本來就計算量不合理的大,速度慢到讓人抓狂

如果我說的是對的!我真的不用類似上圖這樣分分合合的複雜愚蠢演算法,也不用GPU就可以把影像辨識做到目前這個水準?那為什麼GPU風潮會那麼被炒作得那麼霸道?原因就是很多人堅持採用類似上圖的MLDLCNN等等高成本低效率的演算法,硬是橫柴入灶想作影像辨識的結果!

這些演算法其實還沒充分證明他們可以達到市場高辨識率的需求,但是硬體廠商已經看到商機了!如果影像辨識開發廠商都像我這麼作?沒有超額的運算需求,不必購買新的特殊設備來作影像辨識,他們不就沒搞頭了!所以非鼓勵大家繼續迷信MLDLCNN不可!AI軟硬體廠商互相勾結的結果,就是大家都被騙了!以為影像辨識非這麼做不可?其實當然不是的!這個騙局其實也撐不久了,遲早會自己破滅的!

當然每種演算法都有不同的特性強項,我常常聽到AI迷說某某AI系統可以一秒辨識數十張影像,甚至百張?似乎比我的0.119秒還強?但是可以請他們試試看作我做到的事情!如果他們做得跟我一樣好,辨識率一樣高,我的公司早就不在了!大家可以問:為何市面上沒有那種AI產品可買?即使有賣,價錢也都高到沒人買得起?因為「使用GPU」是一件很花錢的事情!真正賺錢的一定不是終端的使用者!而是賣相關設備與中介軟體的廠商,全球最大咖就是輝達了!

其實他們所謂的「辨識」多半只是「找到」目標而已,找到可能的目標還必須一一完成內容辨識,評估正確性,最後選出最佳答案,如果你的找目標程式只是用統計資料猜測的,正確率不會高過八成,你的最終辨識率就會低於80%了!但是我的這種軟體產品辨識率都是高於95%的!而且他們僅僅是「找目標」也必須用很多GPU幫忙才能這麼快的!那些都是錢啊!而且根本沒有必要!因為有更簡單更有效率的選擇!就是「不用」那些演算法,也就不必用GPU了!

我的作法很直覺,就是二值化→輪廓化→切割目標→篩選目標→字元辨識,非常傳統但是非常有效率,沒有浪費任何時間在CNN最自豪的卷積(Convolution)矩陣運算上,我們的演算法都是點、線與封閉區塊的影像處理技術,須知只要一出現用特徵矩陣掃描全圖的動作,運算時間就是傳統運算的數十甚至數百倍再多的CPU核心都不夠他們浪費的!

當然我們公司確實對傳統的OCR模式演算法做了很多改良、優化與補救的新發明新設計,做到了很多專家原本認為OCR做不到的事情!如果我還是教授,需要SCI論文的績效,我可以對此議題寫很多論文的!因為已經是業界人士了,所以我們的發明除了在此部落格介紹之外,只有一小部分變成我的RD的碩士論文!我們的網路聲量不大但是擲地有聲!因為我都會附上實例說明,用過我們產品的客戶也都深信不疑!因為那都是真的!不像那些AI吹噓的都是不確定的未來式!

我們不靠炒作AI虛幻的概念,推銷AI課程、教材、軟體,或製作AI相關的周邊硬體維生!我們只是善用最低成本的演算法達到最高的辨識率,我們是靠開發出便宜好用高辨識率的軟體維生的!我們也真的做到了!從車牌辨識、貨櫃碼辨識、瓦斯表辨識、考卷辨識,到工地揚塵與路面髒汙辨識等等,都是一貫的不必使用任何一般規格電腦以外的軟硬體輔助,就已經是市場上速度最快的辨識軟體了!隨時歡迎來檢驗挑戰我!

高效率、低成本、高辨識率!這才叫做真正優秀的AI吧?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181112141