網路城邦
上一篇 回創作列表 下一篇  字體:
開發一個瓦斯表度數辨識核心要多少錢?
2023/06/21 08:05:59瀏覽886|回應0|推薦2

這是我替欣桃天然氣公司開發中的瓦斯表度數辨識核心,因為所有競標議價簽約等程序都已完成,是已執行中的研發案,即使對於該公司來說,也已經沒有任何機密了!我跟他們的承辦人員之間也沒有暗盤,交易狀況越公開就越好,還可以替兩家公司打廣告!所以我可以大方地跟大家分享介紹,讓大家多知道一些AI影像辨識研發市場的實況。

事實上我的開發早在去年就已大致完成,他們的技術部門主動與我聯繫,也提供很多照片供我評估,我也很快做出辨識原型程式,在議價程序開始前他們就已經知道,以雙方認定應可辨識的影像為基數(約1000張),我的原型模組辨識率已經趨近百分之百了!他們是不是也與別家影像辨識公司有類似的接觸詢問?我就不清楚了!他們不會講,我也不會問的!

原本聽說議價時還會有另一家公司來競標,但是我到場時他們說那家公司主動放棄不來了!我變成唯一一家議價的廠商,只象徵性地略減一萬元報價之後以35萬元的價格成交!以目前一般市場行情來看,我的價格應該是破盤到粉碎的超低價了!對手如果聽到風聲,知道我的價格那麼低,辨識率又那麼高,當然是不敢來了!

一般人買東西都是幾千最多幾萬元,聽到幾十萬好像就覺得貴了?但是研發專案比較像請專家做幾個月甚至一年半載的工程,幾十萬算是少的了!略懂影像辨識的人都可以想像,要讓型式不一的數十種瓦斯表都能正確辨識,即使技術上做得到,但是要做的事情可不少!如果按照MLDLCNNSOP,資料量至少要幾萬張,不但要一一標記資料答案,還要設計各式各樣的「訓練」計畫,反覆做實驗調整,最終要到99%辨識率,沒有三五個月甚至一年半載是一定做不好的!

一個大公司要動員兩三個年薪近百萬的RD半年作此計畫,如果你是老闆,你會報價多少?35萬大概只夠支付其中一個RD的計畫內薪資而已,鐵定是會賠錢的!但對我們公司來說,這個報價是剛剛好,以單一計畫的收支來說,我不會虧本的!主要原因就是我們用的方法非常有效率!真的都是一個人兩三個月內單兵作戰就可以做到好!

首先是我們公司已經有非常成熟的車牌辨識技術,這個瓦斯表辨識議題需要的大部分技術,都可以很快很簡單地從車牌辨識核心移植過來,大部分是簡化而不是新增功能!所以我的原型其實花不到一個月,我單兵作戰不必找我的RD幫忙就做好了,辨識率也達標了!

這幾天採購交易的行政程序完成,他們前天問我何時可以「交貨」?我說隨時都可以,昨天略事整理就將軟體原型給他們開始測試了!接下來的工作只是被動依據例外案例作調整而已,譬如上圖就是不知甚麼原因,同樣是他們開發的手機App,經過某些手機拍的影像被程式讀入後會自己轉90度,變成無法辨識。我的核心就必須在內部設法增加程式,讓轉或不轉90度的影像都能辨識。

這個小問題我大概花了十幾分鐘,加上三四行程式就搞定了!反正接下來已經沒有沉重的研發工作了!35萬的工作等於有30萬已經入袋了!我們對此案付出的行政接洽時間可能還比實際研發的時間多!我怎麼會虧本呢?我用OCR的方法根本不需要標記很多資料,大約只用一千多張就夠做所有的辨識率統計了!

重點還是使用ML那套方法研發辨識核心實在太沒效率了!要使用太多資料進行太多的「訓練」!不像我用OCR的傳統方式,全彩→灰階→二值化→輪廓化→切割目標→正規化字元→比對字模→群組字元,照表操課沒兩三天就可以做好主程序,再花十天半個月就可以調整各種邊緣案例完畢,反正很快就搞定了!一個人一個月的工作賺三十多萬,那是部長級的薪資了!怎麼會虧本呢?我的RD為何不幫忙呢?因為她手上進行中的類似案子比我更多!

影像辨識的工作種類很多,或許不是每一種辨識都可以使用我們公司熟悉的這套方法,但只要是辨識特定目標字元或圖案的專案,我們絕對是可以完勝MLDLCNN團隊的!光是我們開的價格就可以讓他們完全無法跟進了!只有我們做不完或不願意做的案子,才可能輪到ML團隊去撿拾,所以你還覺得要到業界作影像辨識,一定要學ML、DL與CNN嗎?我們就是在業界真實過活的影像辨識公司啊!我們不用那些東西日子過得更好!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=179450267