網路城邦
上一篇 回創作列表 下一篇   字體:
在我的平行宇宙中,影像辨識可以不必使用DL與CNN!
2024/09/30 01:29:20瀏覽559|回應0|推薦7

上面這張200萬畫素影像中的貨櫃碼,我可以只用135毫秒就正確辨識出來!這是貨真價實地從我的實驗軟體中抓出來的實驗畫面!而且我老是白目的挑戰甚至侮蔑主流派的MLDLCNN,深怕有人說我作弊說謊,所以我同步將我辨識步驟中的主要程序的耗時數據也一併輸出讓大家驗證參考了!我是影像辨識廠商沒錯!但這絕對不是一般廣告!這是科學事實

我只花了44毫秒從上面的200萬畫素的全彩影像中抓出必要的RGB資訊,組織成對比最佳的灰階圖再加以二值化,並切割成獨立目標變成下圖!擷取RGB資訊的部分其實那些號稱AI影像辨識的人也必須做的!我的程序與他們差異不大。差別是我繼續做到二值化與目標切割,只用了44毫秒?就很神了!重點是完全不必使用GPU哦!普通規格的電腦與作業系統就OK了!

從上圖中我切割分析出了高達7549個獨立目標!我根據它們的狀大小與相關的位置互相排列組織搜尋,只花了72毫秒就找到了可能是貨櫃碼的正確目標群組!他們可能是一橫排、兩橫排,或一直排的形式,我的程式都可以正確找到(如下圖)因為完全不必使用到CNN耗時的Convolution卷積運算!所以很快!只要一用卷積運算,耗時就至少是一百倍了!到時沒有GPU幫忙你就死定了!但那些鳥事都跟我無關的!

有了合理的目標群組,我只花了15毫秒就可以辨識出正確的貨櫃碼內容!當然這些過程有相當的複雜度,包括用格式資訊補遺漏失字元,用檢核碼公式查核逆向修訂辨識內容等等,但是只要不必用DLCNN等演算法,就不會拖慢辨識時間,慢到必須使用GPUNPU等等額外的助力!你還覺得那些使用CNN的人很高尚嗎?他們只是沒有穿鞋就不會走路的笨蛋!

相信只要真的學過影像處理,確實做過影像辨識基礎練習的人都可以聽懂我上面的敘述!也可以體會我為何可以如此快速完成這些影像辨識,徹底擊潰使用MLDLCNN影像辨識的原因!他們不知道的,只是我在這些研發過程中細心完成的技術細節而已!我真的讓傳統的OCR進化升級了!

他們都一定知道的是:只要使用到DLCNN等技術,影像辨識就會慢得不得了!非要請GPUNPU幫忙不可!你用你自己日常用的一般電腦與作業系統,是絕對跑不動MLDLCNN模式開發的軟體的!至少無法像我的軟體那麼簡單快速!一旦用了DL與CNN就是把影像辨識變成一個只有貴族富豪才能玩的奢侈活動了

所以我的具體成就就是:我讓影像辨識可以在一般電腦環境中順暢實作與實用!在我的這個多重宇宙之中,任何人都可以不需要MLDLCNN就可以作影像辨識,還做得很好的!你是喜歡在我的這個平行宇宙?還是那個只能用DL與CNN做影像辨識的平行宇宙呢?

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=181117314