網路城邦
上一篇 回創作列表 下一篇   字體:
很多影像辨識是必須關著門做的!你知道嗎?
2024/04/25 06:55:12瀏覽631|回應0|推薦6

NEC 在日本推出行動設備的雲端影像辨識服務

影像辨識是一個複雜的技術,尤其是現在流行用MLDLCNN等所謂的AI技術作影像辨識,一個不可說的秘密是:開發與執行這種模式的影像辨識都是非常昂貴的!很難做成像是PhotoShop之類的軟體,賣到一般人的電腦中執行的!大公司們期待的商機經營模式大概都是像上面報導的一樣!準備向輝達公司買類似超級電腦的GPU伺服器,建立雲端影像辨識系統來賺這種錢!

這是不是表示我這種小型的影像辨識公司就會被消滅了?就像超商把柑仔店消滅一樣?我應該怕得直發抖嗎?我應該就此收山轉行退出這個江湖了嗎?其實完全不必的!影像辨識是個超複雜龐大的應用科技,而且絕大多數應用都必須非常高的精準度,可以說直接就MLDLCNN的開發模式做的影像辨識軟體擠到邊緣了

最樂觀的說:這些AI模式軟體是以統計學為基礎,只能作到七八成準度的物體追蹤定位,可以是各種「精準影像辨識」的前處理作業!譬如找到街景中的車牌目標,再讓真正的精準車牌辨識軟體接手做出98%以上的辨識正確率!很多時候這些只能搜尋目標的AI是可有可無的!我的車辨軟體就完全不需要那種AI幫忙找目標,還跑得更快更準!如上報導所說用雲端辨識文件照片中的內容,其實也不是那種AI做的,而是傳統的OCR軟體!只ML、DL與CNN就可以獨立做好的影像辨識應用幾乎是零

重點是:各式各樣的影像辨識應用都需要走完最後一哩路,達到很高的辨識率,這些就是我們這種小廠商絕對不會被淘汰的原因了!我們絕對會有做不完的「科學」專案,而且都是最重要的最後一哩路的工作!用模糊辨識找到貓狗是一種技術,精確辨識是哪一品種的貓或狗?是另一種影像辨識技術。知道是貓或狗沒有甚麼商業價值,能準確辨識是哪一種貓狗才有價值!MLDLCNN能做的只限於前者!我做的影像辨識才是後者!誰比較重要?各位可以自己判斷!

這兩天正在跟一位客戶討論如何幫一家大公司設計辨識單據的影像辨識軟體,我又意外發現了一個我們不會被淘汰的關鍵原因!這位客戶替很多單位做過客製化的辨識軟體,但他們本身沒有開發影像辨識核心的技術,所以都是購買封裝好的通用辨識核心,或是上傳影像到某些雲端平台執行辨識的!就像賣自有品牌電腦的廠商核心的CPU都不是自製的!這才是業界常態,我這種公司是很稀有的!

但是這次他的客戶說要辨識的單據有機密性,是不宜上傳到任何公司外的網站的!就像我們公司已經做過很多的閱卷辨識軟體,考卷當然不宜送到雲端辨識,不然駭客們可能還沒放榜就可以先偷窺到重要考試中某個名人子弟的成績或考卷拿去賣了!簡單說就是有資安的疑慮啦!我們賣的所有軟體都是自製辨識核心的,客戶可以關起門來閱卷(辨識),所以絕對不會有資安疑慮

因為這次客戶的需求是數十種不同格式的單據辨識,要有效率就必須一一客製化各種格式的精準辨識流程,買現有的通用辨識模組需要間接的增加很多額外工作,還未必準確!又不能使用雲端辨識的資源,所以就非找我們討論不可了!這個業界都知道,我們是絕對有能力開發辨識核心技術的優質團隊!簡單說就是此案必須客製化開發自有辨識核心,做好後給客戶安裝在他們自己的電腦內運作!為了資安他們公司做這些工作時可能是完全切斷網路的!

對我們來說唯一不願承諾的就是手寫辨識而已!因為即使投入長期研發也未必可以提高辨識率到實用的水準,當然不是我們這種小公司能夠硬幹的事!其他純印刷的單據內容辨識,或是替有手寫部分的單據辨識格式切割需辨識的手寫欄位子影像,我們都可以承做的!

所以啦!我們公司都是賣斷軟體的經營模式也是持續會有市場有顧客的!因為一旦使用雲端辨識,就表示你放棄了待辨識影像的保密與自主權,當然會有很多應用是絕對需要保密的!但是大公司多半不會輕易釋出核心的辨識技術到一般市面流通的軟體中,怕被破解嘛!或是他們的技術需要超級電腦才能順暢運作,所以他們就等於是被困在雲端的神仙,我們就是可以到府服務的土地公了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180539989