網路城邦
上一篇 回創作列表 下一篇  字體:
誰知盤中飧,粒粒皆辛苦!
2022/10/04 03:32:16瀏覽1776|回應1|推薦7

這幾天在忙甚麼?就是在建立一個瓦斯表度數辨識程式的「實驗環境」!我們收到一千張的這種影像,客戶希望我們可以製作一個高辨識正確率的軟體。這當然沒有問題,這是典型的OCR,只是從一般的文件掃描推進到手拍影像,我們公司就是專做這種工作的!還承諾最終的辨識率,排除明顯反光失焦的例外,合理範圍內的影像可以達到98%

他們很高興也充滿期待,但是該公司高層說:沒有看到足可採信的辨識數據分析報告之前就不願支付一毛錢!這就尷尬了!我們公司的車牌辨識核心,或是閱卷護照辨識等等核心程式,即使辨識能力超強到世界第一了!還是無法直接套用到這個地方的!對症下藥才會藥到病除,辨識率極高,我說的98%辨識率是我估計我們的技術一定可以做到,並不是倉庫裡有現貨可以用!

電腦玩家們應該都知道,網路上已經有很多免費的OCR軟體或APP,只要把包含英數字的影像丟進去,字元辨識結果就出來了!如上的數字辨識成功率至少九成,他們為何還需要找我的公司呢?原因就是如果不是針對性客製化的辨識核心,就不可能達到高辨識率,至少要95%以上才是堪用的影像辨識軟體。

這就是很多人的盲點了!要達到實用標準的影像辨識不能用猜的!一定必須精確客製化!或者反過來說:「通用」的影像辨識核心即使可以用,辨識率與運轉效能一定不如找專業公司客製化研發出來的辨識核心!就像你可以到賣場買到便宜的衣服,但是要高度合身舒適,一定不如訂做的西裝旗袍

我們做的其實就是這種生意!針對你的特殊目的辨識做出最高辨識率也最高效率的辨識核心!即使是面對神奇的AI影像辨識軟體,聲稱甚麼都能辨識,我們也不會失去商機的!多功能的一般汽車到了賽車場上就不夠好了!登山時也會卡卡,我們就是製作特殊目的使用時的師傅了!

但是各位可曾想過?客製化是一件簡單的工作嗎?如果我已經可以辨識更難的各種情境的車牌影像,我的軟體就自動可以辨識較單純的瓦斯表嗎?事實上就是不行的!我的技術水準當然做得到,但是就像藝術家的工作,任何一座雕像都是一件獨立耗時的工作。

我需要做的事情其實很多的!如上是必須先建立實驗程式,讓我可以一一分析每一張影像中的每一個目標,須知瓦斯表的數字字型與車牌相似但畢竟不同,數千張拍攝影像會出現的環境變數也會不同!沒有好的研發分析工具,我根本無法深入研發!這就花了我幾天的時間了!但是我的客戶高層認為這是不需要成本的?或是我活該要吸收承擔的!

我的粗糙原型核心辨識率大概就跟你網路上下載的免費軟體差不多,我必須有如上的實驗程式為基礎才能一一分析失敗案例調整辨識核心,也才能達到高辨識率!我跟外行爛公司的差距,是我知道如何處理很多例外狀況,所以最終我可以達到98%以上的高標!

只有這個工作嗎?差得遠了!我今天要做的事情更累更繁瑣!就是一一目視標記一千張的瓦斯表影像,在檔名中加入正確的辨識結果,這就是機器學習派的人說的「Tagging」了!我要提供客戶整體辨識率的數據,當然必須建立標準答案!如果今天下班之前我可以標記完一千張影像的正確答案,你是老闆你認為應該給我多少工錢呢?

我之前有請過工讀生幫我做這種工作,標記一張至少是五元!一千張就是五千元,大約是兩個整天的工作量!總之,這就是我的專案研發很堅持客戶能先付一半工錢的合理原因!這次因為客戶的堅持我退讓了!原因當然也是因為我很有把握可以做到,那筆錢應該是跑不掉的!就冒險「投資」了!

但是我希望大家都看到:研發工作不是躺著幹的!寫軟體不像砍柴伐木你看得到勞力付出,但是試想一下看完一千張影像一一寫出辨識結果,那不是勞力嗎?你會為此收多少錢呢?如上圖的設計實驗專用程式,也是需要我兩三天的努力,還不能找工讀生,必須我用專業知識能力親力親為,教授三天的工錢是多少呢

所以不要再說軟體業是沒本錢的生意了!誰知盤中飧,粒粒皆辛苦啊!等我將這些林林總總的準備工作做好做完提出辨識率報告時,我的專案也快完成了,會不會有合理的工錢呢?卻還毫無保障?這就是我們目前的業界對於影像辨識這個新產業的態度!或許也要怪那些只會吹牛卻從來無法達到客戶需求的AI影像辨識詐騙集團吧?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=177242579

 回應文章

終南山
等級:8
留言加入好友
2022/10/04 07:04