網路城邦
上一篇 回創作列表 下一篇  字體:
我的影像辨識軟體真的會自己找字哦!
2022/10/18 10:44:13瀏覽1622|回應0|推薦8

為什麼大家都不喜歡OCR?急著把它拋棄,擁抱「神奇」的CNN等等號稱有AI神秘感的新技術?事實上影像辨識就是一個實事求是的科學,不管你用甚麼技術方法都不可能無中生有!看不到的東西就是看不到!如同警察辦案,我們就是那些偵探,努力找到各種微物跡證,試著把原來該有的目標拼湊或是硬挖出來而已!

如上圖就是一個好經典的案例,不僅光線偏暗,滾動的字元轉盤還剛好轉到跟邊框相連!所以那個數字2就是一般人認為使用OCR技術不可能辨識成功的狀況!但是真的不可能嗎?我就辦到了!

事實是:我先用OCR的常規可以做到的技術「盡量」辨識出可以完整切割被確認的字元!接下來就像拼圖一樣,如果我很確定2的位置「應該」有個數字,我就可以發動搜索!這不太困難的!因為你已經找到好幾個字了,字的大小與間距等都不難估計,在好像缺字的空隙找差不多大的數字,即使他與背景沾連,我也會把它硬切出來,上面的2字就是被我開刀從背景中切出來的

其實我們一般人腦中都會這樣思考的!每個人的腦中其實都有這種程式!我比較厲害的只是將這些大家都會的思考過程用幾何學解析與使用程式實作出來而已,這不叫人工智慧?甚麼叫做人工智慧?一定要是那種一般人無法理解的抽象數學嗎?喜歡講點人話就沒學問了嗎?

這就是我認為穩定可靠的影像辨識邏輯了!不像現在流行的CNN,太迷信複雜的數學模式,反而不信任大家都知道,也天天在使用的常識!我認為是很奇怪也很不科學的研究方向!從確定的清晰資訊去推理搜索不是那麼清晰的目標,即使字很不清楚,我猜的答案也會八九不離十了!

這就是我的影像辨識會有高辨識率的關鍵!如果要堅持大鍋炒飯的CNN或機器學習,我根本就不可能會有高正確率辨識結果!大家現在也慢慢開始看到機率統計先天的不確定性了!想用CNN等技術辨識如上那麼模糊的影像,還希望辨識率高到99%?簡直是緣木求魚!連90%都不可能了!但是使用我的邏輯,盡量拼湊確定的訊息,高辨識率就會可以期待了!

上例是我嘗試辨識642張天然氣表題庫的最後一張,我終於拿到100分了!當然這只是題庫,真正上場時我不會永遠答對,但是就像準備聯考,642題的參考書題庫都可以考100分了,我當然敢承諾聯考至少可以考到95分吧?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=177300585