網路城邦
上一篇 回創作列表 下一篇   字體:
我找到越南車牌影像了!但是…
2025/01/03 07:28:53瀏覽346|回應0|推薦8

感謝熱心讀者提供的資訊,我在Kaggle網站找到了很多越南車牌的影像,如上大概就是停車場出入口的情境,總共有數千張之多!應該是足以做為我研究驗證越南車牌辨識核心之用了!

有點奇怪的是這些影像的解析度非常低!以現在一般影像取得的來源來說,這麼低的畫素應該算是古蹟了!即使是十年前的低解析度影像,我用過很多的!也多半是320X240的寬高尺度,380X285?我真的從來沒看過,直到我測試時碰到幾張字元太小的影像,忍不住用PhotoShop放大一點時,才發現這個寬高比與常見的640X480影像是一樣的!

所以我高度懷疑這些影像原來應該就是640X480的規格的!果真如此,我的辨識軟體就可以直接使用得很順暢準確了!但是降低解析度之後如果剛好字元部分也比較小時,就容易產生錯誤了!我是可以用軟體重新取樣回到640X480的解析度,但是已經在他們刻意降解析度時遺失的細節資訊當然永遠回不來了!

有趣的是:為什麼他們要刻意降低解析度呢?內行人應該都知道,字元已經相當小,接近可以正確比對字模的邊緣了,你還要降低解析度?當然會讓最終辨識率變低的!難道是因為磁碟空間不夠用?還是怕檔案太大網路下載太久?十年前可能真的是因為這些理由,現在的環境當然不可能是這種原因了!

所以我估計他們刻意降解析度的理由只有一個!那就是要遷就MLDLCNN的極高運算量!盡量降低原始影像的資料量,縮短CNN目標搜尋與MLDL學習訓練的時間啦!如果保持640X480的解析度,使用那些資料作機器學習的人就會多花十倍以上的時間了!為了減少這個痛,即使知道是削足適履揮劍自宮,知道一定會降低最終的辨識正確率也不管了!先止痛再說!

其實Kaggle這個網站就是讓人玩機器學習用的網路平台!所以我絕對不是亂猜侮蔑機器學習的!他們一定會考慮使用者的方便,如果資料量大到讓多數人都跑不動機器學習,這個網站的來客數也就會大減了!這充分凸顯了我一再提到的:MLDLCNN的基本大問題!太浪費運算資源了!如果我是他們這個平台主要的使用者,他們就完全不必刻意降解析度的!最終的辨識率也會保持在最高的水準

如果不用機器學習,像我一樣使用傳統影像辨識的方式研發一樣的車牌辨識軟體,這個網站根本不必替我擔心的!我日常研究使用的影像,也是現在一般停車場使用的影像,就是百萬畫素或以上的!我從研發到實用過程中都不必降解析度,一點都不會浪費時間作大量冗長的計算,可以保持在最高解析度的影像上辨識目標,辨識率當然很高啦

我相信網站上的影像如果是七八年內拍的,原始解析度也一定是1280X720左右的水準!但是使用機器學習技術的開發團隊恐怕都必須先降解析到字元都看不太清楚的程度再開始學習訓練他們的模型?不然就會花掉太多時間與電腦資源!錢與時間的成本已經是機器學習使用者最大的摩天障礙了

他們說不出的難言之隱,我就幫他們大聲說出來了!我真的高度同情這些身在水深火熱的機器學習地獄中的同行與同業!願上帝保佑你們的靈魂!奉勸各位:苦海無邊,回頭是岸!不是沒有其他方式做好影像辨識的,我就活得很好,有如在天堂伊甸園!遠離ML、DL與CNN就會看到幸福的曙光了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181596495