網路城邦
上一篇 回創作列表 下一篇  字體:
新版辨識核心幾乎考到滿分了!
2020/04/28 10:32:13瀏覽989|回應0|推薦8

疫情緊繃,大概多數人都在自主健康管理吧?這個月生意確實沒以前好,有兩個客製化專案也因為對方設備一直沒架好而陷入等待。沒生意時就是要做研發,月初開始新版車牌辨識核心的研究,好像寫博士論文一樣,每天上班只專心面對一個工作,這種感覺蠻好的!每天都能讓辨識核心越來越聰明,越能辨識更困難的案例,是我成就感的來源!只要產品越來越好,遲早可以賺到錢的!

上面就是我四月份的成績單了!基本上我有三筆Big Data,第一筆來自開放的戶外停車場,共6970張,狀況很多,白天烈日下的陰影,晚上車頭燈的干擾,加上攝影失焦與車牌磨損等等不一而足。第二筆是2951張的路邊模擬停車柱狀況斜拍的照片,多半是五六十度斜視的影像,第三筆是1616張較遠距離手拍的路邊停車影像。

上圖標記ELPR的是我的舊版辨識成績,CLPR則是新版的考試成績,可以看到舊版負隅頑抗,在超大斜角的辨識能力方面依舊還沒被新版超越。當然我現在是作基礎工程,以提升整體包含各種狀況的辨識率為目標,超大斜視的狀況等真的有人要買停車柱專用版的時候再客製化,也就是優化吧!

讓我滿意的是:新版核心因為辨識字元的方法進步了,很多例外處理都可以做得更為通用而準確,如前文所說,真正難的不是寫出辨識困難案例的程式,而是這些程式必須通用於各種狀況,必須能主動「偵測」到各種案例的差異,自行決定該用哪一種例外處理程序,不能讓病人吃錯藥!

我的研究工作就是盡量想出可以辨識出困難案例的演算法,然後試用到所有的巨量資料,盡量不要有副作用讓原本可以辨識的案例反而失敗!如果副作用太大或無法克服,就要拋棄這種演算法,另外想新的算法!所以我才說我的垃圾桶裡面天天都有可以寫成很多論文的新演算法題材!這是真的!

所以我現在覺得「創意」並不值錢!我的演算法設計創意多到讓多數人難以想像,但如果不是可以真正提升整體辨識率的有效方法,其實都沒價值!這就是在學界作研究與業界研發最大的差別了!當教授時只要是新的東西就是業績了!因為沒有必須真正做好產品的壓力,所以就會一直累積很多新的垃圾論文,這樣才能快速升等,以及獲得研究計畫嘛!但其實是浪費了自己的生命與國家公帑!對於科學與真實世界的貢獻都微乎其微,甚至是負面的消耗!

月初開工時新版在停車場資料的整體辨識率大概是96.03%,也就是在沒有甚麼例外處理程序的狀況下,主辨識流程就可以達到這種正確率,其實比舊版已經好多了!因為主程序不同了,伴隨的例外處理程序們也會變得不適用,所以就是全部打掉重做!經過不斷地發明、測試、研究與調整,最後的分數高達99.35%!遠超過我原本的期望。

研究是沒有止盡的,但是以手邊的資料來說,99.35%這種辨識率也表示我可以做的事情已經做得差不多了!該收工作其他事情了!最重要的是可以放心把新的核心裝進我的多種產品裡面了!預期辨識速度會更快,辨識能力還更好,感覺真的很快樂!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=132956140