網路城邦
上一篇 回創作列表 下一篇   字體:
改變始終來自於人性─《大數據》讀後心得(一)
2015/03/19 03:00:00瀏覽2681|回應0|推薦5

壹、前言

  史前時代,資料的軌跡來自於史前遺物的挖掘或遺留的遠古墳墓;歷史時代,資料的軌跡逐漸多元,特別在紙的發明,印刷術普及之後,文字紀錄大量出現,資料出現量的巨變;現在,二十一世紀,由於科技發達,資料的軌跡無所不在,量的巨變已不足以形容,資料已出現質的巨變,《大數據》一書的出版,標示著「資料時代」的來臨。

貳、本書之旨意詮釋

一、本書之摘要

  本書揭示「資料時代」的來臨,大數據(Big Data[1])帶給我們生活、工作及思考等面向的革命,作者除了解釋新時代的衝擊,也針對其中的危機或轉機,提供適切的指引。本書共分為十章,分別從大數據帶來的改變、大數據的基礎、蒐集及使用資料之公司、大數據的黑暗面、應用大數據之責任等面向架構「資料時代」,茲將內容摘要如下:

(一)改變

  大數據帶來三項大改變:量的巨變、質的巨變及相關性預測。

  首先,就量的巨變而言,以前蒐集資料有其侷限,因此,統計學應運而生,發展出各種抽樣調查方法;現在,「樣本=母體」的時代來臨,我們可以蒐集到更多或完整的資料,例如手機上網普及之後,個人生活轉變為以網路為中心的新型態,只要隨身帶著手機,去任何地點──超商買咖啡、餐廳吃午餐、搭公車,都會被定位;瀏覽各種網站、上臉書、傳送LINE訊息,都會被記錄,個人的一舉一動都成為資料。另如個人資料以外,有關橋梁、機器等設施上放置感應器,以監控該項設施的運作,這些訊息也都成為資料。

  因此,大數據的改變,讓我們可以蒐集到完整的資料集,除了上述「樣本=母體」外,也包含個人DNA的完整定序,蘋果公司前執行長賈伯斯就是靠完整的基因密碼,治療癌症,多活了好幾年。

  其次,就質的巨變來說,雖然量的巨變帶來「樣本=母體」的改變,但由於資料來源型態的不同,例如有資料庫形式的結構化資料,也有電子郵件、部落格形式的半結構化資料,或圖像、影片形式的非結構化資料[2],以及測量、分析工具的不完善,以致在精確度與資料數量的取捨上,會偏向允許誤差的不精確,擁抱「愈多」資料,觀察整體的趨勢。

  最後,就相關性預測而言,「愈多」,但不精確的資料,讓吾人在分析過程中,可以掌握大方向、大趨勢,惟這種趨勢只是「正是如此」的相關性看法,而非「為何如此」的因果關係。所以,前者的結果無法解釋為什麼,而想要知道後者則須要實驗。

  以零售業者沃爾瑪為例,該公司很早就以電腦來追蹤商品,經由內部資料分析顯示,每當颶風來臨前,手電筒與小甜點Pop-Tarts兩項商品銷售量會大增。原因為何,並不知道,只知道這兩項商品在颶風來臨前銷售量會同步增加。因此,公司決定爾後在颶風來臨前,將手電筒與小甜點Pop-Tarts兩項商品放在一起,以滿足顧客的購物習性,也提高自己的銷售額。另外,公司也發現,尿布與啤酒兩項商品有高度的正相關,因此,也將兩者放在一起,果然提高營業額[3]

  大數據,不僅帶來改變,也帶來無限商機。

(二)基礎:一切成為資料

  以前,人類記錄世界,是小量資料;現在,我們可以量化世界,記錄一切,但基本條件在於資料化,它是大數據的基礎。

  因此,手機讓我們的位置成為資料,社群網站的訊息讓我們在網路世界的互動成為資料,這些資料化訊息猶如現代基礎建設,用途無窮,商機無限。以UPS快遞公司為例,全美有六萬台車輛,在裝置相關監控、測量設備後,公司不僅掌握車輛的位置、車況,也經由監控資料分析最佳送貨路線,大幅減少里程數,為公司省下油料成本,提高效率及行車安全。



[1] 有關Big Data之中譯,有翻譯為大數據(如本書),或巨量資料、海量資料等,為求統一,本文稱大數據。

[2] 參閱胡世忠著,2013,《雲端時代的殺手級應用:Big Data海量資料分析》,台北:天下,頁50-54

[3] 沃爾瑪案例,除參閱本書(頁78-80)外,另參閱胡世忠著,2013,《雲端時代的殺手級應用:Big Data海量資料分析》,台北:天下,頁43-44,以及涂子沛著,2013,《大數據:數據革命如何改變政府、商業與我們的生活》,香港:中和出版,頁115-116

( 創作另類創作 )

回應 推薦文章 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=lwl121488&aid=21585734