字體:小 中 大 | |
|
|
2015/04/13 11:30:01瀏覽1946|回應6|推薦5 | |
那天和朋友聊天時,談到有關大數據的價值問題,我很驚訝的是台灣人對於大數據有著不可思議的幻想和誤解,不過這在台灣也不是第一次,幾年前有所謂的長尾理論出現時,台灣也確是熱鬧了一段時間,但是時間終就是一把無情的尺,誰還記的長尾理論呢? 老實說,大數據有沒有價值,當然有,但是台灣人在討論時卻常常本末倒置,搞錯了方向,我想就簡單的舉出兩個盲點。一是當資料量很大時,同一套運算法的計算結果是一樣的。二來是重點不在於資料庫,而在於運算法。 首先,大家先想想,如果你已經經過一年的蒐集得到三億五千萬筆資料,代表你每天約可以得到一百萬筆資料,如果你用同樣的運算法來處理資料,基本上我們可以想像在一個月內甚至好幾個月內你都會得到同樣的答案,因為每天的新資料相對於已存資料,在同樣的運算法下根本不可能有任何顯著的改變,這就跟Google找資料一樣,如果沒有廠商贊助或是突發事件,你找的資料順序基本上根本不會有所不同。當然你可以說那就把資料週期縮短或是加乘計算,但是那就不是大數據的事了,而是簡單的直覺判斷問題。 二來目前為止大家都有點搞錯方向,數據就算在那裡,我們還是要有特殊的運算法把他找出來,老實說真會運用大數據的並不一定是數據的巨量,重點是在運算法,因為能夠找到合理運算法的人才能真正找出有價值的數據,而不是擁有數據的人,用一個例子來說,中國可能是全世界擁有最多頁岩氣的國家,但是他卻沒法開採,因為他沒有技術。這就跟擁有資料的人一樣,重點是運算法,而不是數據本身。 台灣是一個很淺而且沒有耐心的社會,所以常常跟著人家後面搖旗吶喊,但是卻從來沒有仔細想想,這些流行本身是不是對的,有沒有價值,都沒有仔細想清楚,以前的常尾理論是如此,這次的大數據看來也是會步入同樣的後塵。因為據我的瞭解,即使是國外,投資大數據成功的公司都很少,基本上是只有50%左右。常言到,外行的看熱鬧,內行的看門道,可不要被這種社會氛圍所欺騙了! |
|
( 知識學習|科學百科 ) |