網路城邦
上一篇 回創作列表 下一篇   字體:
食髓知味,記得好康在哪裡?也是AI的重點!
2026/03/01 05:23:59瀏覽82|回應0|推薦0

我作影像辨識與其他專家顯著的不同就是:不論我學會與使用了任何抽象複雜精密的演算法,我都不會讓我的這個工作與自己的常識與直覺脫鉤!上面這個辨識算是做好了,原圖是1920X1080,辨識完成大約需要0.-0.3秒,但是我立刻想到:他們的應用是連續拍攝辨識一樣的場景!所以被辨識到的目標位置應該是一直都保持一樣的!

為了方便客戶檢視環境理解辨識的場景,整個影像是不宜被拍攝成只有數字面板的特寫畫面的!所以輸入辨識核心的一直都是這樣相當複雜龐大的影像畫面,但是我們必須辨識的目標其實只是其中的一小塊,有必要每次都做完整的全圖影像處理嗎?所謂的食髓知味,黃鼠狼吃到一次雞舍的雞,下次當然是直指目標直接跑到雞舍吃雞,不會地毯式搜索四處找食物了!

所以我的軟體可以在辨識到合理正確答案之後,「記住」正確答案在影像中的位置,甚至一些目標明暗度的參數,做為下一次辨識的參考,因為我們知道除了目標數字其他環境是不會變,或是我們不必關心的!就像黃鼠狼聰明到會記得經驗,所以找到雞吃的效率變高了!我的辨識需要的時間也瞬間變成1/3!如果畫面變了,當然目標辨識不到,我的軟體就會恢復全圖搜索了!就像雞舍被農場主人搬遷或封鎖了,黃鼠狼就必須恢復原來的覓食模式一樣!

這不就是「AI」了嗎?我的軟體善用經驗值變聰明了!可以省下很多不必要的運算,所以辨識速度變快了!也變得省電多了!應該是皆大歡喜吧?但是我知道輝達與台積電都不會高興!因為運算需求變少了,就代表他們的硬體產品價值需求變低了!

正因為AI的背後有這個矛盾的產業鏈利害關係!所以其實效率極差,並不適合用於影像辨識的MLDLCNN等技術才會這樣被炒作吹捧成為影像辨識的「主流」技術?他們從來就不是辨識的最好工具,以後也一定不會是!但是礙於矛盾的產業利益,歹戲一定還會拖棚好長時間的!這段時間我就是贏家了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=186737704