網路城邦
上一篇 回創作列表 下一篇   字體:
不是不會做,而是有沒有必要這麼做!
2024/12/19 11:22:05瀏覽393|回應0|推薦7

上面這張網路上搜到的新加坡車牌算是很刁難的案例,有位長期互動的高手級讀者看到我最近在做車牌幾何校正的研究,就手癢嘗試用貝茲曲線擬合這個車牌的上下曲線,再據以校正成直立的字元,建議我可以這麼作!甚至如果我覺得有用還可以向他買程式碼!

這真的是功力很高的人才做得出來的精緻影像處理!我目前的版本其實只用直線方式算出概略的字組水平傾斜,據此大致轉平之後再用個別字元的左右傾斜角度進一步校正,沒有用到曲線的擬合,算是直線的擬合吧?在數學上簡單很多,但是已經準確到不可能認錯字了!如上例用我的程式也可以輕鬆算對的:

老實說,我確實有想到過用曲線的方式處理這種扭曲,以我的數學與程式設計能力也確定可以寫出實作程式的!所以我從來不需要使用OpenCV之類的程式庫!只要有原理公式我就一定可以正確寫出程式,寫錯了也很容易驗證修改到對嘛!所以沒做,是因為用一次方程式就已經可以達標了,不必殺雞用牛刀!

業界研發工作的特性就是這樣,凡事都是以目的導向還要控制成本,要用最少的成本剛好做到需要做到的事情!以此例來說,如果使用較複雜的數學,增加的精確度又不會讓實質辨識率更高,多出來的程式開發時間與軟體執行時的較多運算量(耗電)就是不需要投入的成本了!用MLDLCNN做影像辨識的人所以會被我天天批評,就是他們的作法太不符合成本效益了!計算量超大,辨識率卻沒有比較高,這是搞甚麼東西嘛?

所以即使我不必採用這位讀者提出的方法,我還是很欣賞他!因為他的數學與程式能力真的很好!能想到這麼作,還真的可以實作出來,表示他的影像辨識與程式功力都不同凡響!絕對不是那些囫圇吞棗的半調子AI玩家,他真的願意踏實理解與解決問題,影像辨識就是應該這麼做的!現在卻被膚淺的假AI唬弄到極少人願意或有能力這樣看問題解決問題了!

嗚呼哀哉!現在是MLDLCNN當道的狀況,這真的是一個影像辨識的黑暗時代!不知道還要亂多久?大家才能理解與接受其實那是一條絕對走不通的死路!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181530579