字體:小 中 大 |
|
|
|
| 2026/03/28 05:04:45瀏覽323|回應0|推薦4 | |
我常常說做影像辨識很像偵探辦案!過程就是從影像中收集所有證據重建犯罪過程的那個唯一的事實!我們知道車牌是物理世界中一個真實的存在!也知道它們應該會遵守監理單位製做合法車牌的規定,如果是你隨手亂做的假車牌呢?那辨識錯誤當然就罪不在我了! 看到上面這個極端的辨識成功案例,不免就會想到福爾摩斯小說中流傳千古的名言:「當你排除了所有不可能,剩下的無論多麼不可思議,一定是真相!」按照正常的程序那個被繩索跨越遮住(切斷)的U字是無法通過初篩被視為一個字元的!即使勉強被視為一個1或J字,也可以從字距的異常上被認為不可能! 如果我們排除了那裏有個1或J的可能性,就會發現按照車牌整體字距的邏輯,那裏一定有一個字!因為不可能有個車牌的字元(2與2)之間空格那麼大!就像警察辦案時有證據指向謀殺案的凶器被丟到一個湖裡,即使我們無法直接看到凶器,也應該去打撈的!即使凶器被打碎腐爛了,都必須努力撿拾碎片拼圖判斷出原貌的! 這個案例就是這樣!我們已經知道不可能是1或J!但是一定有一個字元!那就是從其他的候選人中找到最像的那個字!客觀的字模比對分數告訴我的是有69%像是U,同時間J的分數只有40%!其他字就更不像了!所以即使分數不高我也認為最合理的答案應該是那裏有一個U了! 我就是這樣做影像辨識的!其實以數學運算的角度看,我的這些推理過程雖然數學過程很複雜,但是總計算量並不大!遠遠少於CNN搜索目標時的矩陣運算!但是精確度與合理性卻遠遠高於純粹以比對人為判斷標準答案的成功率為基礎的XX學習!所以我作出來的影像辨識產品,不論是速度或準度都會完全輾壓XX學習成果的! 簡單說,我的理念是一開始就保持腦筋清楚,一步一步像警探辦案一樣逼近犯罪的事實核心!每一步驟都是合理有效的!反之,用CNN、ML與DL等技術做影像辨識,就像是家財萬貫浪費無度也不肯用心經營家族事業的敗家子了!耗盡資源卻總是一事無成! 當然我覺得更重要的是:我的作法過程比較好玩!我真的無法想像每天用ML、DL與CNN工作會是多無聊而且恐怖的事情?很像自己只是穿著無塵衣組裝手機的作業員?IC裡面到底是甚麼碗糕?我根本完全不知道!因為是機器自己拼湊學習出來的嘛!我怎麼知道它們是怎麼「想」的?太無聊了啦! |
|
| ( 心情隨筆|工作職場 ) |












