Python 資料科學實戰教本 - chenlizon 的書香天地

字體：小中大

Python 資料科學實戰教本

2022/09/19 06:37:02瀏覽216｜回應0｜推薦0

【題材涵蓋最全面！一本書掌握資料科學 / 數據工程必學 know-how！】

　　從大數據到人工智慧世代，其背後蘊含的關鍵技術與理論不脫資料科學、機器學習的範疇。基本上，資料科學需要的背景知識與技能相當的多，通常要會 Python 程式設計基礎、熟悉相關 Python 套件和模組的使用；再加上機器學習的基礎就是機率和統計，因此也免不了得學機率和統計知識，可說有一拖拉庫的主題等著你去學，也難怪市面上各主題 (程式基礎、統計、套件、機器學習建模...) 的專書滿坑滿谷，一時間實在讓人難以消化...

　　為了降低讀者初學資料科學面對的負擔以及混亂感，我們精心設計了這本入門實戰教本，秉持讓讀者「買一本抵多本」的精神，本書一次涵蓋所有入門必須熟悉的重要題材，同時也將初學資料科學的脈絡梳理清楚。

　　在章節的安排上，本書從資料取得的網路爬蟲開始，提供一個標準 SOP 來幫助讀者從網路取得資料；接著說明資料科學必學的 Python 重量級套件，再接著介紹機率、統計和探索式資料分析的基礎知識，最後進入最熱門的機器學習、深度學習建模主題。

　　這一連串「取得資料 → 探索資料 → 預測分析」是一套完整的資料科學 / 數據工程實戰訓練，跟著本書掌握這些重要 know-how 後，就不難看懂網路上眾多資料科學、機器學習專案的 Python 程式碼和線上教材，甚至參與資料科學、機器學習的網路競賽；希望本書能協助讀者開啟資料科學家 / 數據工程師的成功之路！

本書特色

　　□ 資料科學三部曲：取得資料 → 探索資料 → 預測分析

　　□ 一次補足最入門的統計和機率基礎

　　□ Python 開發環境與基礎語法快速上手

　　□ 從網頁爬蟲、資料清理到資料視覺化，快速完成資料探索的預處理程序

　　□ 將清理後的資料存入 SQL 資料庫，便於日後存取利用

　　□ 實踐資料科學的四大套件：NumPy、Pandas、Matplotlib、Seaborn 一次掌握

　　□ 用 Scikit-learn、tensorflow.Keras 套件實作最熱門的 AI 機器學習應用

作者介紹

作者簡介

陳會安

　　學歷：美國猶他州州立大學電腦碩士

　　經歷：多所大專院校企業講師、松崗電腦產品經理、美商 PH 出版經理、專業電腦書作者

　　國內知名資訊技術作家，已出版超過 100 本電腦著作，包括：程式設計、網頁設計、資料庫、系統分析、資料結構等各種不同主題。近年研究人工智慧、機器學習 / 深度學習、資料科學、網路爬蟲、大數據分析和物聯網相關課程與圖書寫作。

作者介紹

目錄