Python 資料分析入門寶藏書,選它!

圖靈小悅發表於2021-02-07

入門資料分析最簡單的途徑就是去學習 Python 生態系統中,最流行也是最基礎的庫之一:Pandas,尤其對於從 Excel 轉向 Python 的朋友來說,從效率到功能會發現很多驚喜。

為什麼要使用 Python 這樣的程式語言和 Pandas 庫這樣的工具來處理資料呢?為了實現自動化和再現性。如果需要對多個資料集執行一組特定的分析,那麼程式語言能自動分析這些資料集。

Pandas 庫能夠完成許多工,比如:

  • 讀/寫不同格式的資料
  • 選擇資料的子集
  • 跨行/列計算
  • 尋找並填寫缺失的資料
  • 在資料的獨立組中應用操作
  • 重塑資料成不同格式
  • 合併多個資料集
  • 先進的時序功能
  • 通過 matplotlib 和 seaborn 進行視覺化操作

Pandas 庫提供的功能是相當全面的,通常是被用在資料採集和儲存以及資料建模和預測中間的工具,更讓人欣賞的一點是,Pandas 庫整合了眾多功能卻不臃腫,其中一個原因是它提供的是重要卻簡潔的功能。

同樣因為 Pandas 庫易於自學,且網際網路給大家提供了資源上的極大便利,很多人邊實踐邊學習,在解決問題過程中,遇到不會的問題,搜尋一下就能瞬間找到問題的答案並獲得滿足感,因此也導致很多入門者的知識和技能也是碎片式的。但我們知道,系統的學習會讓你在使用 Pandas 庫的時候更加高效。

這本資料分析入門必讀的寶藏級教科書——《Python 資料分析:活用 Pandas 庫》,助你一書掌握工作中相見恨晚的 Pandas 庫使用技巧。

01 #本書亮點#

手把手教學,涵蓋 Python 資料分析的方方面面

Pandas 庫有很多高階的功能,但是想要掌握高階功能前,需要先掌握它的基礎知識。這本書在開篇細緻講解了 Pandas 庫的基礎知識和常見用法,通過簡單的例項展示瞭如何使用 Pandas 庫解決複雜的現實問題,以及如何利用 matplotlib、seaborn、statsmodels 和 sklearn 等庫輔助進行 Python 資料分析,涵蓋了資料處理、資料視覺化、資料建模等內容。

據說精讀此書,相當於系統學習了 Python 資料分析的入門課程。

知乎上有一點陣圖靈讀者製作了這本書結構圖,很直觀地展示了書裡所覆蓋的知識點,手把手講解,方方面面都安排上了。

enter image description here

本圖來源於圖靈讀者的知乎文章,原文地址 https://zhuanlan.zhihu.com/p/242181755

以例項闡釋概念,實用性強

本書最大的特點就是每個概念都是通過簡單例項來闡述的。

講解透徹,直擊要點

這本書原版和中文版上市後都得到了眾多讀者好評。

enter image description here

enter image description here

enter image description here

enter image description here

圖文並茂,簡潔易懂

enter image description here

用 matplotlib 繪製帶顏色的散點圖

enter image description here

seaborn 計數圖

enter image description here

使用 seaborn 的 distplot 方法繪圖

圖片

seaborn KDE 圖

enter image description here

用 seaborn 的 violinplot 繪製小提琴圖

02 #本書作者#

丹尼爾·陳(Daniel Y. Chen)

Lander Analytics 公司資料科學家,Software Carpentry 和 Data Carpentry 的講師和課程維護人員,DataCamp 的課程講師。目前在弗尼吉亞理工大學社會與決策分析實驗室從事政策決策資料分析。

相關文章