字體:小 中 大 | |
|
|
2024/11/15 03:40:56瀏覽51|回應0|推薦0 | |
上面這張影像的辨識成功對我來說意義重大,是個重要的研發里程碑!因為我的車牌辨識軟體所以能在台灣奠定高技術的形象與地位,就是我可以用正常的速度正確辨識出因為視角刁鑽而高度變形扭曲的車牌!不需要買我的甚麼高價格特殊版本?我的所有台灣車牌辨識產品預設都有這種超能力的! 但是研究東南亞車牌之初,我並不是直接套用台灣車牌辨識的既有流程,我想從全新的角度從頭來過,發展出不一樣還可能超越台灣車牌辨識的新技術,所以我是用較為簡易的流程起步,基本上是假設車牌沒有明顯歪斜變形的!所以跟別家產品相似,傾斜到七八度,或是斜視超過30度,就無法辨識了! 最近基礎辨識的部分做得差不多了,我就開始將幾何變形的演算法逐步加入了!而且我對之前台灣版的幾何校正也不是很滿意,有些新的想法就趁此機會實作出來了!目前新的演算法雖然可以修正的角度不如台灣版,但是校正的準確度與穩定性是比台灣版更高的!有達到我的研究目標。 這種可以高效率處理車牌影像幾何校正的技術,就是我可以擺脫OCR技術的老舊形象,不再只能辨識掃描文件中的字元,也可以辨識在真實世界3D立體空間中高角度拍攝目標的關鍵!你在任何論文中都找不到類似演算法的!我曾跟我的碩士RD說:如果妳想繼續攻讀博士,拿這個議題做論文就綽綽有餘了!保證風光畢業,還會得獎! 其實影像辨識演算法的研究中,大家都如鴕鳥般規避了一個最困難的基本問題!就是目標一定會因為拍攝角度產生變形,這種變形會將原始目標的特徵劇烈改變。如AOI或OCR的技術,要從假設目標是在一個2D的平面,遷移到辨識3D立體空間歪斜拍攝的目標非常困難!沒有聰明的幾何校正技術發明,如上的扭曲車牌當然無法辨識! 即使以現在被炒作到好像是影像辨識主流(?)的CNN(類神經網路)來說,他們搜尋目標的基礎也是根據要辨識目標的「特徵」建立Kernel矩陣,然後據以掃描全圖找目標。他們做人臉辨識時,找的是正面人臉的眼睛加上嘴巴形成的倒三角形特徵,如果從側面拍攝,或目標人物裝可愛歪著頭拍照,他們就辨識不到了! 如果要死守CNN的原則,用更多的「變形」特徵矩陣來掃描影像中所有角度的人臉或車牌,那需要的計算量就太大了,是根本不可能的任務!即使勉強用輝達生產的超級電腦做到,耗費的研發與使用成本也會大到讓人難以承受!所以這是所有影像辨識技術共同的難題,連大家迷信的AI技術對此也沒有合理的對策,但以車牌辨識來說,我確實有這種技術!還很節能省碳,完全不會耽誤辨識時間,也不需要買特殊電腦的! 這是我前幾天開給柬埔寨客戶的規格,在台灣版的規格我是寫可以傾斜到±50度,斜視到±60度的!現在的柬埔寨版當然還沒這麼厲害,但是要我寫傾斜只能到10度?或斜視不得超過30度?我會覺得很丟臉的!絕對不是大師級的水準!所以這幾天就是積極優化新辨識核心的這一個部分! 前面那張案例顯示我可以辨識到斜視54度,上面這個案例顯示我可以辨識到傾斜32度,雖然不是每張這種角度的影像都會百分之百辨識成功,但已經可以證明我的規格不是亂開的!我寫得還很保守咧!如果32度都有成功案例,我保證20度之內一定OK,當然是很負責任的承諾! Trust me, you can make it! |
|
( 心情隨筆|工作職場 ) |