網路城邦
上一篇 回創作列表 下一篇   字體:
如何給辨識核心做考試?多執行緒惠我良多!
2020/04/07 07:50:05瀏覽930|回應0|推薦4

最近在給我的新版辨識核心做考試了!其實跟做機器學習的過程有點像?先是將數千張有車牌的照片用目視方式看出正確車號,然後將正確答案寫入檔名之中,當然有可能同一輛車被照好幾張,所以檔名不會只有車牌,通常是照像的時間,加上去就不會重複了!這在機器學習的工作中叫做Tagging,等於是給題庫做標準答案。

這種費眼力的活當然不適合LKK作,所以就會有些夠細心也有耐心的小朋友可以賺外快了!幾千張照片一一檢視改檔名,一批資料就可以忙上很多天,我總得給他日薪上千元吧?我很難想像一般機器學習通常需要的數萬或數十萬張照片是要發多少工錢?耗掉多少時間啊?這就是機器學習無法迴避的成本問題,還沒開始學習就要先花掉好多時間好多錢了!老師沒告訴你嗎?沒錢的人玩不起機器學習的

我的作法是將有正確答案的影像放在一個目錄,開始用迴圈辨識所有的照片,答對的就Pass,答錯或答不出來的就拷貝一份到另一個目錄,這樣考完試就可以到錯誤資料的目錄中檢討考題了!這時候就是要作個案分析,找出錯誤的原因,像是看病的醫生,能醫的就修改程式讓它以後可以答對!但也要注意修改程式的副作用,實在沒招,醫不好的也只能黯然移入安寧病房了!

就是這樣不斷地模擬考→檢討答案→修正程式錯誤→調整參數→新增演算法,至於效果好不好?再跑一次幾千筆的資料,看看總分有沒有提高?就知道了!如果新的修改有問題,分數就會明顯下降,分數進步就是做對方向了!真的很像在準備聯考!精益求精!

但是這個做法一直有個小問題,跑一次幾千張的測驗通常會耗掉半小時左右,一天上班時間這樣玩,只能有七八個回合的實驗,枯等跑程式的時間內只能上網看新聞,要想個題目寫篇文章是不太夠的!做其他工作心思也無法專注,等到考試完畢,又有點忘掉剛剛修改了那些程式?感覺挺累的!

所以今天一早趁著精神好,就將我的實驗程式改成多執行緒版本,從一筆一筆算,變成七八筆資料一起算,我的電腦有八核心嘛!現在考試一次只需要三五分鐘了!伸個懶腰上個廁所,看看信箱訊息,再看一下新聞首頁,知道天沒塌下來,就可以去看成績了!這樣一天能做的事情就多出好幾倍了!有多執行緒真好!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:http://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=132387510