網路城邦
上一篇 回創作列表 下一篇   字體:
客製化的OCR軟體當然可以做得更好!
2024/05/18 04:45:58瀏覽673|回應0|推薦9

什麼是 OCR 軟體?OCR 軟體的重要性為何?

昨天受邀到台北拜訪一家會計軟體服務公司,他們有一種軟體可以掃描辨識各種收據發票,讀取關鍵的文數字資訊,節省人工輸入成本,方便作帳用的!聽起來很了不起,可辨識數十種格式的發票收據!但即使排除手寫的部分,實際的辨識率仍然不夠高,碰到印刷品質較差的單據,辨識率更糟!

這對他們來說是個大困擾!就像車牌辨識一樣,如果辨識率不夠高,老是辨識失敗需要叫人來處理,就不如乾脆人工收費了!這些單據辨識率越低需要人工補救的工作量就越多,經營成本越高,所以「能辨識」不表示就有效益,辨識率不夠高他們的客戶就寧願不用他們的軟體,直接人工作業了!

他們現有的版本也是若干年前請其他宣稱有影像技術專業的軟體公司開發的!但是顯然辨識率的問題無法改善,因此才考慮另行開發新軟體的可能性,我就是他們找去諮詢的影像辨識專家!所以昨天不是我對他們做簡報,而是他們簡報現有軟體的使用狀況,想聽聽我的意見,看看能否另行開發出更好的東西?

我聽完他們的簡報立即了解,前一版本是封裝如上的通用OCR軟體製作的!畢竟影像辨識的技術門檻較高,前開發公司應該不是(也沒有能力)針對每種單據設計針對性的最佳化辨識流程!所以就用現成的OCR軟體盡量辨識出單據上的所有文字,再從中撿出需要的字串,如統一編號或消費金額等等。也就是前開發公司並沒有影像辨識的核心技術,所以面對客戶希望提升辨識率的要求根本無法回應,就跟目前很多停車場的車牌辨識核心來自大陸或歐美一樣!

這有甚麼問題呢?首先是這些OCR軟體設計的重點並不是能盡量辨識出品質較差的影像,而是可以辨識出幾乎所有格式的中英文,可以想像必然是很笨重龐大的軟體!所以他們那個會計軟體的使用經驗是一跑辨識,電腦的CPU與記憶體用量就大增!還很挑電腦,規格差一點的就會卡卡跑不動!無形中增加了使用客戶的電腦設備採購成本!

但是會計軟體需要辨識的只是單據中幾個特定欄位的數字,外來的OCR軟體當然無法精準操控,還是會鉅細靡遺的執行「全文」辨識的預設功能,一一比對資料庫找出所有文數字的答案,所以軟體執行時大部分的電腦資源是用於辨識會計軟體不需要用到的中英文字!這好像是殺雞用牛刀?拿機關槍打螞蟻?用導彈射蚊子?小題大做太浪費資源了!需要的關鍵做得不夠好,不需要的事情則燒掉客戶的很多冤枉錢!

我之前在精益科技公司擔任顧問時,對於這些OCR軟體知之甚深!該公司很多產品也是封裝其他公司製作的OCR軟體的,要提升辨識率就是必須在使用OCR之前先做一些影像前處理,讓原始影像更清楚,雜訊更少,OCR的辨識率就會提升了!直接自行開發優質OCR的成本實在太高,台灣沒有公司自製這種東西的!據說品質最好的專業OCR軟體是來自俄羅斯,廣告中Adobe公司的OCR還不夠看,專業公司是不會採用的。

理論上如果要簡單一點讓這位客戶的現有會計軟體提升辨識率,我可以模仿當初精益科技的做法,在OCR辨識之前插入影像前處理的程序,但是那個會計軟體不是我做的,我當然無從插入任何程序!即使我可以做到,OCR軟體嚴重浪費電腦資源在不需要的工作上的狀況還是無法避免的!因為我更不可能介入那些OCR軟體的內部運作程序!

所以我的建議是針對各種單據格式一一開發客製化的辨識流程,這樣就可以針對不同單據的影像特性做最佳化的影像前處理,也可以很精簡的只針對需要的幾個欄位作辨識,這樣保證辨識率會大增!電腦資源的消耗也不會再那麼不合理的沉重,執行速度會更快,電力會更省,使用的電腦規格也可以更低更便宜!客戶一定會非常高興!也間接降低地球暖化,讓全世界都受益!

當然要一一開發數十種格式單據的最佳客製化辨識流程需要時間,交給我們公司做的話大概也需要一整年!這只是辨識核心而已,要重建整個新軟體還包括使用者介面與資料庫處理等等,所以昨天我們其實是兩個軟體公司攜手去談這個案子的!如果成案,我的夥伴公司會把軟體的其他部分做好,我只要專心作辨識核心即可!

重點是:如果按照我的建議,新版軟體不再需要購買封裝外來的OCR軟體,辨識率會大增還特別省電快速,電腦規格大解放!後續省下的人工、電腦設備與電費應該很快就會把開發成本賺回來的!

大家習慣性的會好奇詢問:這些工作與目前流行的AI技術有關嗎?我可以明確回答:這些OCR軟體包括我將製作的客製化OCR都是影像辨識的範疇,但都與ML、DL與CNN等所謂的AI技術毫無關係的!不要以為作影像辨識一定需要它們?事實正好相反!大多數已商業化的影像辨識產品都與這些技術無關的!不要被AI詐騙集團騙了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=180626720