行遠必自邇，每一趴的辨識率都不是僥倖得來的！ - 鄉下老師

字體：小中大

行遠必自邇，每一趴的辨識率都不是僥倖得來的！

2022/10/05 04:16:06瀏覽1325｜回應0｜推薦10

昨天算是很有成就感，首先是將1000張原始影像一一目視辨識，排除很多根本不合理，甚至沒拍到瓦斯表的影像，然後將目視決定的正確答案加入檔名之內，這表示之後我用程式讀取辨識這張影像時，就可以「對答案」了！

這也就是機器學習中說的Tagging了！結果是整理出642張應可辨識的實驗資料。當然何謂應可辨識？是存在很大落差的！如果一開始就納入太多很難辨識的案例會讓研究很難聚焦，如果只納入極容易辨識的案例，對於辨識程式的進化就會太慢了！看不出弱點嘛！這個拿捏的尺度我就很難說清楚了，大概像去餐廳吃飯，要盡量吃飽，但是不要點太多東西多到吃不完的量。

做好這個題庫已經可以是一般工程師一整天的工作了！老闆我如果請人做，就大約必須付他兩千元的薪資了！但是我在大約三四小時內自己搞定了！接著是開始建立針對這個辨識議題的辨識流程，這時很像那個賣糖果的故事？我可以先抓一把應該過量的糖果，然後用減法調整到正確的量，也可以相反的先拿少一點，然後慢慢加到正確量。

我已經有很多各式各樣的現成辨識流程軟體，但都不是剛好適用的，我可以拿簡單的原型逐步加程式，也可以拿車牌辨識程式來玩，逐步刪減調整，其實都不容易，我傾向用前一個策略！所以一開始我的辨識正確率就是如上的只有大約一半！

但是昨天做到這個程度時我已經心情大好，非常滿足的提前下班休息了！真正的影像辨識研究應該就是這樣的！我應該擔心辨識率那麼低嗎？其實只是牛頭不對馬嘴，接下來很多天我會一一研究辨識失敗的原因，譬如上例就是因為字型不對，數字2用台灣車牌的字型去比對答案居然是3？調整一下辨識率就馬上增加一趴了！還有上百的機會可以讓我一一排除障礙提升辨識率的！

等到我把大多數明顯的一般辨識障礙排除後，辨識率應該就會站上大約70-80%，那時就需要設計一些針對這種辨識目標的特殊演算法！讓辨識結果侷限於特定的範圍，好像圍網捕魚，該抓到的目標，即使很模糊，我知道他就在那哩，所以硬猜也能命中八成！我的機器學習是那個階段才會啟用的，那又是另一個階段的工作了！對我來說，那時才是真正的「客製化」研發！

反正以我的經驗，只要人眼看得清楚的目標沒有辨識不出來的道理。這跟當老師教書的過程也很像，沒有學生天生喜歡失敗考不及格的！只要老師願意去研究了解學生學習卡關的實際原因，一一用更好的教材教法去教，學生的成功率就會大幅提升了！我就是這樣用很多別人認為的朽木，雕出很多好作品的！

不多說了！我要繼續上工了！

( 心情隨筆｜工作職場 )