網路城邦
上一篇 回創作列表 下一篇   字體:
一個具體的實例讓你想想:是誰的影像辨識比較AI?
2026/02/27 10:43:27瀏覽103|回應0|推薦1

前兩天接到這樣一個案子的詢問!已經買過我的車牌辨識的精誠科技公司,當然對我的車牌辨識技術相當滿意!他們之前曾經委託別家公司製作如上的影像辨識功能,就是辨識某種瓦斯表上的度數!當時的辨識目標需求只有數字的部分,據說也花了不少錢,應該是幾十萬吧?

現在終端客戶又需要加上辨識前面的兩個英文字代號,就是上圖中的CV了!他們問之前開發辨識核心的公司,需要「追加」多少費用?該公司的答覆居然是必須重開一個價格跟之前差不多的專案來重新製作?就是要再花數十萬?精誠公司當然很不樂意!他們從上次跟我的接觸知道我不只是做車牌辨識,各種影像辨識我們都會做的!所以來問我直接開發英數字都辨識的核心要多少錢?多少時間?

看過照片了解辨識環境之後,我說只需要12萬元,兩周內提供測試版,一個月內可全部完工!事實上此事根本八字還沒一撇,我用他們提供的一百多張照片,這兩天內就幾乎完成了90%的工程,上面的黑底白字標籤上的英數字就是我的實驗軟體辨識的結果!現有的123張影像辨識率已經是百分之百了!與我接洽的經理當然是喜出望外!

其實我很能體諒並不是那間之前的公司獅子大開口攔路搶錢!也不是我低價搶標流血競爭!完全就是因為使用的技術不同,研發成本就是差距那麼大!高價給他們做他們並沒有暴利,低價給我做我也不會虧本!因為他們真的是MLDLCNN等所謂的AI技術開發的,我則是用我熟悉的OCR為基礎的傳統技術。成本差距就是那麼大!

看到上面的綠色與藍色的框框了嗎?當你想讓機器學會辨識那些數字之前,就是必須手動一一標示需要辨識的目標區,以及標準答案!這在機器學習的術語叫做Tagging!想像一下數千張影像一一用人工作好標記,需要多少人力時間?老闆需要付出多少工錢?這樣完成準備工作之後,才能開始進入機器學習或深度學習的工作流程,當然學習訓練的過程也有很多必須人工不斷調整的工作,而且還少不了要用到昂貴的GPU電腦!這些都是要研發公司的老闆花錢的!

所以當客戶要求多辨識那兩個英文字時,他們真的別無選擇!只能全部過程打掉重做!重新做大量資料的標記,重新訓練一個完全不同的模型!所以為了多辨識兩個簡單的英文字要重做一個完整的專案?聽起來不太合理?卻是那些使用MLDLCNN技術的團隊難以言宣的痛點!啞巴吃黃蓮大概就是這種狀況!人家以為你是漫天開價?實際上你卻很可能入不敷出?

換作是我呢?如果他們之前就是找我做,我也開出12萬元的價錢用OCR技術做到辨識率99%!真的不必一個月就可以上線使用!即使完工後又要我多辨識兩個英文字,我也頂多兩三天就可以搞定!收費呢?可能是兩三萬元而已!因為真的一點都不麻煩!多建幾個英文字模,多辨識兩個位置的字而已嘛!基本架構流程都不需要改變太多的!

所以我們用真實具體的業界影像辨識案例來看!到底是誰比較「AI」呢?我一再聲明MLDLCNN真的不適合用來作影像辨識,上面這個實例就是一個殘酷的現實差異!我做這種辨識核心的辨識率絕對比MLDL更準!也保證執行速度會快很多,也保證不需要額外的電腦周邊硬體支援!研發成本更低,且時間還快好幾倍?

請問是那些要價很高的AI影像辨識公司會先倒閉?還是被笑稱技術「落伍」的我的小公司會先倒閉?最後是虛幻虛無的AI概念股會獲勝?還是真的可以省錢高效率做出優質影像辨識軟體的團隊會勝出?別犯傻了!用機器學習做影像辨識根本就是電腦硬體製造公司在背後推波助瀾的一場騙局而已!大家都笨到濫用ML、DL與CNN做傻事,電腦(GPU)的需求就暴增了嘛!結果是硬體商大賺錢,做影像辨識的都倒大楣!

在此要補充說明的是:即使是我,也不是所有的影像辨識專案都那麼便宜(12萬)的!這個狀況是攝影機與目標瓦斯表都是固定位置連續拍攝的!所以影像環境非常固定!我的辨識核心需要處理的變數就很少了!像之前替某天然氣公司做的瓦斯表辨識核心就困難多了!因為是拿手機拍攝的影像,會有歪斜變形角度略為傾斜的問題,瓦斯表的種類也非常多,還會包含一些背景雜物等等。

但即使如此那個專案我的報價也只是35萬!有趣的是:當時對方的採購單位習慣性地要我降價?表示他們有盡責殺價嘛!我的回答是:「請貴公司先到別家公司訪價後我們再談!」結果幾天之後他們反而急著找我趕快簽約了!應該是怕我後悔報價太低了!顯然別家的價格都很嚇人的!這也沒辦法,只要是用機器學習作的東西就一定是很貴的!你們知道嗎?大家都想靠AI賺錢,殊不知用那種大家以為AI的技術開發影像辨識其實根本賺不到錢!錢都被人工費用與昂貴硬體燒光了嘛

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=186689229