網路城邦
上一篇 回創作列表 下一篇  字體:
盡信書不如無書
2018/05/19 04:21:35瀏覽1887|回應0|推薦8

關於影像辨識,所有你應該知道的深度學習模型

這是一篇很好的文章,雖然我一直不看好深度學習的研究方式,自己的公司專作影像辨識專案好幾年了!也從來沒用過任何類神經網路或機器學習的工具或工作流程,依舊是用基礎的影像辨識技術,針對問題找直接解決特定目標辨識的方法。但是我真的很高興地看完了這篇文章,對於這種技術有了更多的認識。甚至請RD跟我一起研讀這篇文章,討論比較與我們現有技術的差異。

但不好意思,我的結論仍然是有點負面的!在學術研究的角度,他們努力研究出快速決定一個影像中所有區塊的演算法,看似非常重要的「影像辨識第一步」!他們努力的方向是想建立一個「通用」於各種影像辨識需求的技術,但是實務上,每一種辨識最終目的不同,未必需要這個演算法的全部,或者已經用到了這個演算法的所有精髓,仍然很難簡單有效的找到需要的目標。

拆解開來看,他們用的很多步驟技巧我也在用,但絕對不曾想過將他們整合起來,變成一個可以「廣用於所有目的的綜合性演算法」!這種研究寫成論文是很漂亮,但鐵定沒效率!誰都可以用,但是任何目的的使用都不是最有效率,要依賴大量資料與重複運算來讓電腦「學習」(術語是Training)去自我調整?真的非常沒效率,簡直是吃飽太閒!依據需要直接選用最佳的演算法步驟不是更好?

譬如我們正在做的一個案子,是希望從監視器畫面中看其中人物是否有穿著特定形式的工作服?因為衣服的亮度顏色與環境背景不保證有差異,是否有足夠的資訊去切割為不同區塊?毫無保證!譬如穿白衣的人在近似白色的背景中活動。此時努力在同一影像中用顏色亮度特性去切割,叫做事倍功半,但是只要用前後兩個影像做差異分析,算是時間軸微分的概念,就很容易可以看出人形目標在哪裡了!

當然,如文章中展示的這些演算法原始作者都是很聰明的科學家,他們應該會很容易地跟我一樣,面對這樣的問題立即跳脫他們的研究主題,選擇更簡單但是合用的方法去解決問題。但是這就給他們自己打臉了!因為他們提出的這個方法其實根本不夠「通用」,不是每一種辨識目的都可以用這個演算法做為最好的開始!所以對症下藥,先詳細診斷病情,再決定如何治病還是必須的過程。萬靈丹?即使存在,也絕對不是最對症有效的藥!

如果我們的目標是車牌辨識,其實未必要將全圖都做很完整的區塊切割。直接找出高對比的少數目標即可!因為車牌是白底黑字,天生就是設計來給人快速辨識的。至於畫面上的人與房屋等等目標是否正確切割?根本不需要!所以未必要跑完整的演算法,簡化版的更好更快!對商業軟體來說,快速反應是很重要的!而且演算法越簡單就可以用越便宜的電腦執行,這是節省成本,也是產品競爭的優勢。

所以我說,書是一定要多讀的!但在實務工作上你應該花更多時間在理解問題,在你的知識中找出最合用的來面對問題。科學家努力研究出最通用有效率的演算法,讓更多人可以有簡便的工具,這沒錯!但是真正甚麼都能辨識的「工具」大概只有人的腦袋!過度高估這些大師的演算法可以治百病的話,我可以保證你一定不會變成業界歡迎的RD

這就是古人說的:盡信書不如無書了!我可以斷言:在現階段的影像辨識軟體市場上,針對特定目標的辨識軟體開發,過度迷信特定演算法與依賴深度學習的任何公司團隊都無法和我競爭的!他們燒很多錢卻沒有結果的失敗機率非常的大!就像龜兔賽跑,我的研發速度一開始似乎比較慢,但是我永遠會穩步向前,他們到了一個程度就會很難提升產品品質,因為他們的程式軟體內到底在幹嘛?他們自己也不太知道?要知道的話,就必須回到問題本質的個案分析研究,那不就跟我現在做的事情一樣嗎?

科學研究或產品研發都是沒有捷徑的,別想太多了,老老實實將每件事情都搞清楚才是正辦!機器學習的概念其實是與此踏實理念相反的,它可以是沒有辦法時的辦法,但絕對不值得被尊為影像辨識科學的主流或核心。

( 知識學習科學百科 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=112060911