字體:小 中 大 | |
|
|
2017/06/16 09:48:04瀏覽2123|回應0|推薦5 | |
上圖是一張塗格子的考卷掃描影像檔,左側是我初步辨識出來的結果,才弄了兩三天,「理想狀況」下答案都是對的!這只能說是主程序「粗粗」的完成了!但已經做了好多事情: →灰階→二值化→傾斜校正→輪廓化→辨識目標 →切割出合理答案區的目標→組織目標與題號答案對應 →辨識每個目標的填充程度→判定答案 看起來我做得很快,其實是這這近兩年來研究文件辨識累積下來的技術,回到一年半前,這個東西可以做上一兩個月都未必能好!而且行百里半九十,這只是「理想狀況」的流程!接下來要讓各種有瑕疵的資料考驗,譬如某個格子被塗得特別大之類的例外狀況,主程序不能處理的,就要開始寫例外處理程序,最終要盡可能讓品質較差的影像也可以順利辨識。 有人問了!這好像是多此一舉的工作吧?不過就是電腦答案卡嘛!聯考這麼多年了,不都是用讀卡的感光機器辨識,快得很也很準啊!哪需要寫影像辨識程式?實際上就是有客戶有大量的遠距教學地點,要讓各地考試的實體答案卡通通寄回集中處理時間太慢,成本也太高! 於是想到將答案卷掃描或照相之後,用網路傳回就便宜很多,也快很多了!但是手動掃描就會引進誤差,譬如亮度不一或傾斜等等。答案卡本身是完美的,直接用讀卡機處理當然很OK!但是它們的照片就不會都很完美了!這樣我就有工作啦!這種辨識相對於車牌辨識是較為簡單的!可是很多時候就是一個小小的關卡過不去,整個美好的解決方案就卡住了!我說能做此事時,客戶是很高興的! 接下來我會收到大量的資料,我必須讓我的辨識程式變得更聰明,即使是髒汙的例外都能盡可能正確的解讀,還希望程式效能提升,辨識越快越好!大量閱卷時,時間就是金錢啊! |
|
( 心情隨筆|工作職場 ) |