不是不會做，而是有沒有必要這麼做！ - 鄉下老師

字體：小中大

不是不會做，而是有沒有必要這麼做！

2024/12/19 11:22:05瀏覽393｜回應0｜推薦7

上面這張網路上搜到的新加坡車牌算是很刁難的案例，有位長期互動的高手級讀者看到我最近在做車牌幾何校正的研究，就手癢嘗試用貝茲曲線擬合這個車牌的上下曲線，再據以校正成直立的字元，建議我可以這麼作！甚至如果我覺得有用還可以向他買程式碼！

這真的是功力很高的人才做得出來的精緻影像處理！我目前的版本其實只用直線方式算出概略的字組水平傾斜，據此大致轉平之後再用個別字元的左右傾斜角度進一步校正，沒有用到曲線的擬合，算是直線的擬合吧？在數學上簡單很多，但是已經準確到不可能認錯字了！如上例用我的程式也可以輕鬆算對的：

老實說，我確實有想到過用曲線的方式處理這種扭曲，以我的數學與程式設計能力也確定可以寫出實作程式的！所以我從來不需要使用OpenCV之類的程式庫！只要有原理公式我就一定可以正確寫出程式，寫錯了也很容易驗證修改到對嘛！所以沒做，是因為用一次方程式就已經可以達標了，不必殺雞用牛刀！

業界研發工作的特性就是這樣，凡事都是以目的導向還要控制成本，要用最少的成本剛好做到需要做到的事情！以此例來說，如果使用較複雜的數學，增加的精確度又不會讓實質辨識率更高，多出來的程式開發時間與軟體執行時的較多運算量(耗電)就是不需要投入的成本了！用ML、DL與CNN做影像辨識的人所以會被我天天批評，就是他們的作法太不符合成本效益了！計算量超大，辨識率卻沒有比較高，這是搞甚麼東西嘛？

所以即使我不必採用這位讀者提出的方法，我還是很欣賞他！因為他的數學與程式能力真的很好！能想到這麼作，還真的可以實作出來，表示他的影像辨識與程式功力都不同凡響！絕對不是那些囫圇吞棗的半調子AI玩家，他真的願意踏實理解與解決問題，影像辨識就是應該這麼做的！現在卻被膚淺的假AI唬弄到極少人願意或有能力這樣看問題解決問題了！

嗚呼哀哉！現在是ML、DL與CNN當道的狀況，這真的是一個影像辨識的黑暗時代！不知道還要亂多久？大家才能理解與接受其實那是一條絕對走不通的死路！

( 心情隨筆｜工作職場 )