如何使用Python 進行資料視覺化

碼農充電站發表於2020-12-01

微信公眾號:碼農充電站pro
個人主頁:https://codeshellme.github.io

在進行資料分析的時候,經常需要將資料進行視覺化,以方便我們對資料的認識和理解。

0,Matplotlib 簡介

Matplotlib 是一個視覺化工具包,可以讓我們使用Python 來視覺化資料。

Matplotlib

這裡有一些官方資源你可以點選檢視:

很多更高階的繪相簿,也都是基於Matplotlib,比如seabornHoloViewsggplot 等。

在使用 Matplotlib 時,經常需要用到 pyplot 模組,用下面程式碼引入:

import matplotlib.pyplot as plt

下文中,都用plt 來代指pyplot

說明:
這裡我們只介紹幾種簡單的圖,更多其它的圖,可以檢視官方手冊。
下面的每個函式,只介紹了最簡單的用法,其它更多的引數可以檢視手冊。

1,散點圖

plt.scatter 函式用於繪製散點圖。函式原型:

scatter(x, y, s = None, c = None, marker = None)

引數含義:

  • x, y:分別表示點的橫縱座標。x, y 可以是單個點座標,也可以是一組點座標。
  • s:表示點的大小。
  • c:表示點的顏色。
  • marker:表示點的形狀,可選的值見這裡,比如 marker 的值為x, o, s等。

如下程式碼,畫了三個點:

# 三個點的座標分別是:
#   (2, 5) 
#   (3,6)
#   (3, 5)
plt.scatter([2, 3, 3], [5, 6, 5], marker='o')
plt.show() # 展示圖

畫出的散點圖如下:

在這裡插入圖片描述

2,折線圖

plt.plot 函式用於繪製折線圖。函式原型:

plot(x, y)

引數 xy分別表示點的橫縱座標,一般是一組點座標。

比如下面表格代表5 次數學考試成績:

次數 1 2 3 4 5
成績 89 78 92 79 86

將上面表格資料,繪製成折線圖,程式碼如下:

x = [1, 2, 3, 4, 5]
y = [89, 78, 92, 79, 86]
plt.plot(x, y)
plt.show()

畫出的折線圖如下:

在這裡插入圖片描述

3,直方圖

直方圖用於描述資料的分佈情況

plt.hist 函式用於繪製直方圖。函式原型:

plt.hist(x, bins=None)

引數x是一個一維陣列,bins 可以理解為矩形的個數,預設是10

假如下面是一次數學考試的成績,全班共50 名同學:

在這裡插入圖片描述
將所有同學的成績畫成直方圖,程式碼如下:

scores = [
    96, 89, 95, 91, 94, 95, 92, 98, 95, 93,
    93, 96, 94, 94, 98, 92, 88, 90, 88, 98,
    84, 89, 87, 84, 94, 82, 83, 95, 93, 79,
    84, 91, 86, 91, 81, 89, 77, 81, 77, 70,
    66, 93, 90, 87, 79, 83, 86, 90, 93, 79,
    ]
plt.hist(scores)
plt.show()

畫出來的直方圖如下,橫座標為成績區間,縱座標為人數:

在這裡插入圖片描述

通過該直方圖,可以直觀的看出來每個成績區間的人數。

4,條形圖

plt.bar 函式用於繪製條形圖。函式原型:

plt.bar(x, y, width = 0.8)

引數x, y 均是一個陣列,x 是橫座標,表示資料類別;y 是縱座標,表示每個類別的頻度。引數width 表示長條的寬度。

比如下表是一位同學的期中考試的各科成績:

在這裡插入圖片描述

我們將這位同學的成績單畫成條形圖,程式碼如下:

# 每個科目分別用字母表示
subjects = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I']
scores = [96, 89, 85, 91, 75, 90, 88, 79, 89]
plt.bar(subjects, scores)
plt.show()

畫出的條形圖如下:

在這裡插入圖片描述

5,餅圖

餅圖常用於表示個體佔總體的佔比情況。

plt.pie 函式用於繪製餅圖。函式原型:

plt.pie(x, labels=None)

引數x是一個陣列,表示一組資料,labels 用於描述每個資料的含義。

比如下表是某個公司某年每個季度的收入:

在這裡插入圖片描述

我們可以用餅圖分析出每個季度佔全年收入的佔比,程式碼如下:

# 表示每個季度
quarters = ['1', '2', '3', '4']
incomes = [56, 89, 75, 91]
plt.pie(incomes, labels=quarters)
plt.show()

畫出的餅圖如下:

在這裡插入圖片描述

(本節完。)


推薦閱讀:

決策樹演算法-理論篇-如何計算資訊純度

決策樹演算法-實戰篇-鳶尾花及波士頓房價預測

樸素貝葉斯分類-理論篇-如何通過概率解決分類問題

樸素貝葉斯分類-實戰篇-如何進行文字分類


歡迎關注作者公眾號,獲取更多技術乾貨。

碼農充電站pro

相關文章