字體:小 中 大 | |
|
|
2015/03/19 03:00:00瀏覽2681|回應0|推薦5 | |
壹、前言 史前時代,資料的軌跡來自於史前遺物的挖掘或遺留的遠古墳墓;歷史時代,資料的軌跡逐漸多元,特別在紙的發明,印刷術普及之後,文字紀錄大量出現,資料出現量的巨變;現在,二十一世紀,由於科技發達,資料的軌跡無所不在,量的巨變已不足以形容,資料已出現質的巨變,《大數據》一書的出版,標示著「資料時代」的來臨。 貳、本書之旨意詮釋 一、本書之摘要 本書揭示「資料時代」的來臨,大數據(Big Data[1])帶給我們生活、工作及思考等面向的革命,作者除了解釋新時代的衝擊,也針對其中的危機或轉機,提供適切的指引。本書共分為十章,分別從大數據帶來的改變、大數據的基礎、蒐集及使用資料之公司、大數據的黑暗面、應用大數據之責任等面向架構「資料時代」,茲將內容摘要如下: (一)改變 大數據帶來三項大改變:量的巨變、質的巨變及相關性預測。 首先,就量的巨變而言,以前蒐集資料有其侷限,因此,統計學應運而生,發展出各種抽樣調查方法;現在,「樣本=母體」的時代來臨,我們可以蒐集到更多或完整的資料,例如手機上網普及之後,個人生活轉變為以網路為中心的新型態,只要隨身帶著手機,去任何地點──超商買咖啡、餐廳吃午餐、搭公車,都會被定位;瀏覽各種網站、上臉書、傳送LINE訊息,都會被記錄,個人的一舉一動都成為資料。另如個人資料以外,有關橋梁、機器等設施上放置感應器,以監控該項設施的運作,這些訊息也都成為資料。 因此,大數據的改變,讓我們可以蒐集到完整的資料集,除了上述「樣本=母體」外,也包含個人DNA的完整定序,蘋果公司前執行長賈伯斯就是靠完整的基因密碼,治療癌症,多活了好幾年。 其次,就質的巨變來說,雖然量的巨變帶來「樣本=母體」的改變,但由於資料來源型態的不同,例如有資料庫形式的結構化資料,也有電子郵件、部落格形式的半結構化資料,或圖像、影片形式的非結構化資料[2],以及測量、分析工具的不完善,以致在精確度與資料數量的取捨上,會偏向允許誤差的不精確,擁抱「愈多」資料,觀察整體的趨勢。 最後,就相關性預測而言,「愈多」,但不精確的資料,讓吾人在分析過程中,可以掌握大方向、大趨勢,惟這種趨勢只是「正是如此」的相關性看法,而非「為何如此」的因果關係。所以,前者的結果無法解釋為什麼,而想要知道後者則須要實驗。 以零售業者沃爾瑪為例,該公司很早就以電腦來追蹤商品,經由內部資料分析顯示,每當颶風來臨前,手電筒與小甜點Pop-Tarts兩項商品銷售量會大增。原因為何,並不知道,只知道這兩項商品在颶風來臨前銷售量會同步增加。因此,公司決定爾後在颶風來臨前,將手電筒與小甜點Pop-Tarts兩項商品放在一起,以滿足顧客的購物習性,也提高自己的銷售額。另外,公司也發現,尿布與啤酒兩項商品有高度的正相關,因此,也將兩者放在一起,果然提高營業額[3]。 大數據,不僅帶來改變,也帶來無限商機。 (二)基礎:一切成為資料 以前,人類記錄世界,是小量資料;現在,我們可以量化世界,記錄一切,但基本條件在於資料化,它是大數據的基礎。 因此,手機讓我們的位置成為資料,社群網站的訊息讓我們在網路世界的互動成為資料,這些資料化訊息猶如現代基礎建設,用途無窮,商機無限。以UPS快遞公司為例,全美有六萬台車輛,在裝置相關監控、測量設備後,公司不僅掌握車輛的位置、車況,也經由監控資料分析最佳送貨路線,大幅減少里程數,為公司省下油料成本,提高效率及行車安全。 |
|
( 創作|另類創作 ) |