專心修補不完美的世界 - 鄉下老師

字體：小中大

專心修補不完美的世界

2017/07/20 06:28:20瀏覽1142｜回應0｜推薦10

大家以為我們公司只作車牌辨識嗎？其實我們也做很多奇奇怪怪的文件辨識，譬如下面是東南亞某國的身分證，因為印刷品質不太好，還有背景浮水印，連浮水印的印刷套色都常常會偏移出現彩色疊影，要一一認清楚上面的字，有時連人眼看都吃力。

這種辨識基本上是要套用OCR軟體辨識文字，OCR軟體是神祕複雜且非常昂貴的軟體，銷售時也會吹噓他們的辨識能力如何神奇，就像車牌辨識系統每一家的產品辨識率都自稱是>99%一樣，但是實務上這是不可能的！一般來說他們確實可以認得非常多種的字型與字元(含符號)種類，但是前提是輸入辨識的確實是一個一個完整的字元「圖案」！如果二值化之後每個字都是獨立完整的目標，他們確實甚麼都認得！

但是真實世界的困難就像上面的證件，直接輸入OCR的結果一定是零零落落錯誤百出。這就是精益科技公司的影像辨識研究團隊日常的工作，我們則是他們的顧問團隊！這類疑難雜症他們也醫不好時，就會提出來跟我們討論，甚至直接交付我們開發部分或完整的辨識程序。我是不很像功夫電影裡面的火雲邪神？斧頭幫都搞不定的傢伙就會找我去打打看！哈哈！

我們厲害嗎？像上面這種恐怖的證件經過兩三個月的努力，每周與精益的IP(Image Processing)團隊討論開會研究，昨天RD已經跟我說資料中可見的辨識錯誤都可以克服了！換言之，我們可以開發出自動辨識該國身分證的軟體了，通常辨識正確率不超過99%就算是失敗了！不容易的！

這代表甚麼意義？我們是在「輸出」高科技研發成果欸！這可不是拿先進國家的設計圖代工作IC或寫程式而已哦！反而是我們替先進國家的OCR軟體解決他們都無法直接克服的問題，這不是台灣之光，甚麼叫台灣之光？當教授哪有這麼好玩？哪有這麼神氣？

另一方面，我也在這些工作中看到，我們好像在「修補」這個不太完美的世界，影像辨識可以將真實世界的影像變成電腦可以理解的文數字資料，我們也需要很多這樣的工作，以減少人力、減少錯誤、加快資料處理速度，間接地讓每一件事變得更精確快速，像是身分證辨識就可以讓身分驗證與打擊犯罪更快更準！

但也有人會說我們太笨了！做這些事情幹嘛？等下一批身分證印刷好一點就根本不必這麼複雜的辨識軟體了！我們做事情要「前瞻」啊！作這些遲早會過時失去價值的軟體不是浪費時間嗎？但以車牌辨識的例子來說，七碼車牌比起六碼車牌超好辨識，市場上車牌辨識率90到99%之間的差距都是能否克服六碼車牌容易出現的辨識意外！

那我們要等多久才能全面改成七碼呢？這十幾年間我們能不用到六碼車牌的辨識程式嗎？這就是真實世界運作的硬道理了！未來的事還沒發生，發生之後真正會有甚麼新的問題，我們都是用猜的！因為有可能會猜錯，那「前瞻」的努力不就白費了嗎？誰真的能百分百的未卜先知呢？

反之，我們眼前已經發生，也正在困擾我們的很多問題，這些「有遠見」的人卻認為那是「遲早會過去」的暫時現象，不理他(當鴕鳥一下)就好了！我覺得這些人好像是外星人或未來的人，根本不是活在現在，也不想活在現在，所以寧可不管眼前實際發生的問題，不願投入心力矯正眼前的缺失，解決當下的問題，就是堅持要提「前瞻」的偉大計劃！

還堅持即使打架打到立法院停擺，連台灣都停擺，也依舊要勇闖未知的未來！當大家都說發展AI很重要時，我們是應該從簡單的實務需求作起？如基本的影像辨識市場需求？還是從摸不著邊際，沒有人知道該怎麼作的「人工智慧人才培育」著手呢？

想一想，日本與德國為何讓我們覺得科技很先進吧？他們未必凡事都有遠見，但是大家都知道他們的民族性是：眼睛裡容不得沙子！一定會堅持把眼前不完美的東西做到最好！各位覺得台灣比較需要哪一種人？比較需要哪一種主流思維呢？大膽「前瞻」？還是「龜毛」一點？

( 心情隨筆｜工作職場 )