網路城邦
上一篇 回創作列表 下一篇  字體:
專心修補不完美的世界
2017/07/20 06:28:20瀏覽1142|回應0|推薦10

大家以為我們公司只作車牌辨識嗎?其實我們也做很多奇奇怪怪的文件辨識,譬如下面是東南亞某國的身分證,因為印刷品質不太好,還有背景浮水印,連浮水印的印刷套色都常常會偏移出現彩色疊影,要一一認清楚上面的字,有時連人眼看都吃力。

這種辨識基本上是要套用OCR軟體辨識文字,OCR軟體是神祕複雜且非常昂貴的軟體,銷售時也會吹噓他們的辨識能力如何神奇,就像車牌辨識系統每一家的產品辨識率都自稱是>99%一樣,但是實務上這是不可能的!一般來說他們確實可以認得非常多種的字型與字元(含符號)種類,但是前提是輸入辨識的確實是一個一個完整的字元「圖案」!如果二值化之後每個字都是獨立完整的目標,他們確實甚麼都認得!

但是真實世界的困難就像上面的證件,直接輸入OCR的結果一定是零零落落錯誤百出。這就是精益科技公司的影像辨識研究團隊日常的工作,我們則是他們的顧問團隊!這類疑難雜症他們也醫不好時,就會提出來跟我們討論,甚至直接交付我們開發部分或完整的辨識程序。我是不很像功夫電影裡面的火雲邪神?斧頭幫都搞不定的傢伙就會找我去打打看!哈哈!

我們厲害嗎?像上面這種恐怖的證件經過兩三個月的努力,每周與精益的IP(Image Processing)團隊討論開會研究,昨天RD已經跟我說資料中可見的辨識錯誤都可以克服了!換言之,我們可以開發出自動辨識該國身分證的軟體了,通常辨識正確率不超過99%就算是失敗了!不容易的!

這代表甚麼意義?我們是在「輸出」高科技研發成果欸!這可不是拿先進國家的設計圖代工作IC或寫程式而已哦!反而是我們替先進國家的OCR軟體解決他們都無法直接克服的問題,這不是台灣之光,甚麼叫台灣之光?當教授哪有這麼好玩?哪有這麼神氣?

另一方面,我也在這些工作中看到,我們好像在「修補」這個不太完美的世界,影像辨識可以將真實世界的影像變成電腦可以理解的文數字資料,我們也需要很多這樣的工作,以減少人力、減少錯誤、加快資料處理速度,間接地讓每一件事變得更精確快速,像是身分證辨識就可以讓身分驗證與打擊犯罪更快更準!

但也有人會說我們太笨了!做這些事情幹嘛?等下一批身分證印刷好一點就根本不必這麼複雜的辨識軟體了!我們做事情要「前瞻」啊!作這些遲早會過時失去價值的軟體不是浪費時間嗎?但以車牌辨識的例子來說,七碼車牌比起六碼車牌超好辨識,市場上車牌辨識率9099%之間的差距都是能否克服六碼車牌容易出現的辨識意外!

那我們要等多久才能全面改成七碼呢?這十幾年間我們能不用到六碼車牌的辨識程式嗎?這就是真實世界運作的硬道理了!未來的事還沒發生,發生之後真正會有甚麼新的問題,我們都是用猜的!因為有可能會猜錯,那「前瞻」的努力不就白費了嗎?誰真的能百分百的未卜先知呢?

反之,我們眼前已經發生,也正在困擾我們的很多問題,這些「有遠見」的人卻認為那是「遲早會過去」的暫時現象,不理他(當鴕鳥一下)就好了!我覺得這些人好像是外星人或未來的人,根本不是活在現在,也不想活在現在,所以寧可不管眼前實際發生的問題,不願投入心力矯正眼前的缺失,解決當下的問題,就是堅持要提「前瞻」的偉大計劃!

還堅持即使打架打到立法院停擺,連台灣都停擺,也依舊要勇闖未知的未來當大家都說發展AI很重要時,我們是應該從簡單的實務需求作起?如基本的影像辨識市場需求?還是從摸不著邊際,沒有人知道該怎麼作的「人工智慧人才培育」著手呢?

想一想,日本與德國為何讓我們覺得科技很先進吧?他們未必凡事都有遠見,但是大家都知道他們的民族性是:眼睛裡容不得沙子一定會堅持把眼前不完美的東西做到最好!各位覺得台灣比較需要哪一種人?比較需要哪一種主流思維呢?大膽「前瞻」?還是「龜毛」一點?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=106786529