網路城邦
上一篇 回創作列表 下一篇  字體:
行遠必自邇,每一趴的辨識率都不是僥倖得來的!
2022/10/05 04:16:06瀏覽1325|回應0|推薦10

昨天算是很有成就感,首先是將1000張原始影像一一目視辨識,排除很多根本不合理,甚至沒拍到瓦斯表的影像,然後將目視決定的正確答案加入檔名之內,這表示之後我用程式讀取辨識這張影像時,就可以「對答案」了!

這也就是機器學習中說的Tagging了!結果是整理出642應可辨識的實驗資料。當然何謂應可辨識?是存在很大落差的!如果一開始就納入太多很難辨識的案例會讓研究很難聚焦,如果只納入極容易辨識的案例,對於辨識程式的進化就會太慢了!看不出弱點嘛!這個拿捏的尺度我就很難說清楚了,大概像去餐廳吃飯,要盡量吃飽,但是不要點太多東西多到吃不完的量。

做好這個題庫已經可以是一般工程師一整天的工作了!老闆我如果請人做,就大約必須付他兩千元的薪資了!但是我在大約三四小時內自己搞定了!接著是開始建立針對這個辨識議題的辨識流程,這時很像那個賣糖果的故事?我可以先抓一把應該過量的糖果,然後用減法調整到正確的量,也可以相反的先拿少一點,然後慢慢加到正確量。

我已經有很多各式各樣的現成辨識流程軟體,但都不是剛好適用的,我可以拿簡單的原型逐步加程式,也可以拿車牌辨識程式來玩,逐步刪減調整,其實都不容易,我傾向用前一個策略!所以一開始我的辨識正確率就是如上的只有大約一半!

但是昨天做到這個程度時我已經心情大好,非常滿足的提前下班休息了!真正的影像辨識研究應該就是這樣的!我應該擔心辨識率那麼低嗎?其實只是牛頭不對馬嘴,接下來很多天我會一一研究辨識失敗的原因,譬如上例就是因為字型不對,數字2用台灣車牌的字型去比對答案居然是3?調整一下辨識率就馬上增加一趴了!還有上百的機會可以讓我一一排除障礙提升辨識率的!

等到我把大多數明顯的一般辨識障礙排除後,辨識率應該就會站上大約70-80%,那時就需要設計一些針對這種辨識目標的特殊演算法!讓辨識結果侷限於特定的範圍,好像圍網捕魚,該抓到的目標,即使很模糊,我知道他就在那哩,所以硬猜也能命中八成!我的機器學習是那個階段才會啟用的,那又是另一個階段的工作了!對我來說,那時才是真正的「客製化」研發!

反正以我的經驗,只要人眼看得清楚的目標沒有辨識不出來的道理。這跟當老師教書的過程也很像,沒有學生天生喜歡失敗考不及格的!只要老師願意去研究了解學生學習卡關的實際原因,一一用更好的教材教法去教,學生的成功率就會大幅提升了!我就是這樣用很多別人認為的朽木,雕出很多好作品的!

不多說了!我要繼續上工了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=177246485