使用 Python 進行資料視覺化
1. 簡介
本文件介紹如何使用 Python 進行資料視覺化。我們將涵蓋以下內容:
- 常見的 Python 視覺化庫
- 基本圖表型別
- 圖表定製
- 案例研究
2. 常見的 Python 視覺化庫
以下是 Python 中常用的資料視覺化庫:
- Matplotlib: 是 Python 中最基礎和最強大的視覺化庫,提供廣泛的圖表型別和定製選項。
- Seaborn: 建立在 Matplotlib 之上,提供更高階的統計圖形繪製功能,以改善資料視覺化。
- Plotly: 提供互動式和動態圖表,使其成為線上和 Web 應用程式的理想選擇。
- Bokeh: 專注於建立互動式 Web 視覺化,提供類似於 D3.js 的功能。
3. 基本圖表型別
Python 視覺化庫支援多種圖表型別,以下是一些常見的型別:
- 折線圖: 用於顯示資料隨時間或其他連續變數的變化趨勢。
- 條形圖: 用於比較不同類別之間的資料。
- 餅圖: 用於顯示不同部分佔整個資料的比例。
- 散點圖: 用於顯示兩個變數之間的關係。
- 直方圖: 用於顯示資料的頻率分佈。
4. 圖表定製
Python 視覺化庫提供了豐富的圖表定製選項,包括:
- 標題和標籤: 為圖表新增標題和軸標籤。
- 顏色和樣式: 自定義顏色、線型、標記等。
- 圖例: 新增圖例以區分不同資料系列。
- 座標軸: 設定座標軸範圍、刻度和格式。
- 註釋: 新增文字或圖形註釋以突出顯示重要資訊。
5. 案例研究
5.1 用 Matplotlib 繪製折線圖
import matplotlib.pyplot as plt
# 資料
years = [2010, 2011, 2012, 2013, 2014]
sales = [100, 120, 150, 180, 200]
# 建立折線圖
plt.plot(years, sales)
# 新增標題和軸標籤
plt.title("銷售額趨勢")
plt.xlabel("年份")
plt.ylabel("銷售額")
# 顯示圖表
plt.show()
5.2 用 Seaborn 繪製散點圖
import seaborn as sns
import pandas as pd
# 資料
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10]}
df = pd.DataFrame(data)
# 建立散點圖
sns.scatterplot(x='x', y='y', data=df)
# 顯示圖表
plt.show()
6. 總結
本文簡要介紹了使用 Python 進行資料視覺化的方法。透過選擇合適的庫和圖表型別,可以有效地呈現和分析資料。希望本文件能夠為您的資料視覺化工作提供幫助。