網路城邦
上一篇 回創作列表 下一篇  字體:
影像辨識不是浪漫的高科技
2018/04/15 05:08:04瀏覽1853|回應0|推薦7

我是一個沒受過任何影像辨識科班訓練,甚至連基礎資訊教育都沒接受過的「外行人」!但是現在卻以開發各種目的的影像辨識核心為業,而且真的可以在業界存活得很好!我最想跟普羅大眾分享的經驗就是標題說的:「影像辨識不是浪漫的高科技」。至少「我的」影像辨識事業根本不像多數網路資訊形容影像辨識的那麼浪漫,一定要用甚麼深度學習或類神經網路之類,一般人很難理解的「神奇」演算法!

或許我是土法煉鋼吧?我不敢評論那些神奇的先進人工智慧技術是不是真的很有價值,能做到我根本無法做到的事情。但是我可以分享一些實務經驗案例,讓完全不懂影像辨識的人也可以相信自己一點都不笨!距離影像辨識這件工作根本沒這麼遠!如果你是國高中的物理或資訊科老師,其實現在就可以開始編寫相關教材,指導學生作影像辨識了!

最近有位某醫學院的中醫教授詢問是否可以用影像辨識已經完成針灸的針頭數目?其中兩張同一狀況下拍攝的略為不同角度的照片如下:

如果從第一張照片你就能直接看出手臂上插了幾根針,那麼你應該是外星人!但是第二張照片就應該任誰都很容易判斷有三根針了!即使是目前最神奇的演算法其實也不會比人厲害,我不會殫精竭慮地去想如何從第一張影像中辨識出有三根針,如果可以從第二張照片中用電腦程式模擬出一般人的簡單判斷,指出有三根針,我就已經達到一般客戶的要求了!

事實是在資訊業界,即使台北有南港科學園區,美國有矽谷,全球已經有很多號稱作影像辨識的公司與軟體,這位醫學院的老師還是很難直接找到軟體或人解決這個簡單的問題!「不得已」還是要找到麻豆的鄉下老師,其實我相信不是我最厲害,而是我可以用較低成本較簡單的方式解決簡單的問題。

這位教授在電話中與我溝通時非常客氣友善,知道針很細不是很好辨識,表示可以配合調整拍攝方式,找出最容易正確辨識的方式,他甚至嘗試過用有螢光材質的針在紫外線的特殊燈光下拍攝!拿到照片之後我和RD開會討論,很快就決定好建議的拍攝策略。

我們的建議簡單到不行!就是請他在針的頂端設法加上紅色的亮漆,如果他連螢光材質都肯用了,換成紅漆有何難處?如果針的頂部有一點亮紅色,照片的背景又多半是皮膚、頭髮或醫院診療室的桌椅床舖,不會有亮紅色的目標形成雜訊,那辨識不就很容易了嗎?當然,高標準的針灸辨識目標可能是整根針的位置,尤其是插在人體的位置(穴位),但那是以後進階的研究了,如果連針在哪邊?有多少枝?都還辨識不準確,談那些都是廢話!

如果他接受了建議,要辨識複雜背景中的幾個亮亮的紅點,這是任何有影像辨識基本動作能力的人都可以做到的!我們這個「專業」公司當然會多做一點事,譬如以辨識出的紅點為中心,辨識四周針體延伸的方向距離,就可以往得知針灸穴位的研究方向挺進了!

如果你剛剛從影像辨識相關研究所畢業,聽我這樣講可能會覺得怪怪的?真的不必用類神經網路或深度學習技術嗎?真的這麼簡單?用基本的物理概念就可以開業作影像辨識嗎?如果用學校教的較「佳」或較「深」的技術可以更快更好的解決問題嗎?

至少我接那麼多專案,都好多年了!覺得太難作不到的就直接回絕了,接下的都作好做到了!我根本沒用過那些人家說是影像辨識「主流技術」的東西,更沒用過OpenCVMatlab這類的工具軟體或函式庫!我認為90%的影像辨識需求,像我這樣用基礎物理數學加上程式設計來做就很夠了!包括我的主要產品車牌辨識在內!

我不會低估人工智慧的任何演算法,包括類神經網路或深度學習等等的價值,但是殺雞未必需要牛刀!即使是影像辨識,其實用瑞士刀就可以做好大部分的事情了!這是我對於影像辨識較獨特的經驗與見解。奉勸想進入影像辨識專業的人,不要想太多,也千萬不要輕信神奇演算法之後就不信自己的物理常識了!

( 心情隨筆工作職場 )
回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=yccsonar&aid=111514974