使用 Python 進行資料視覺化

nisan發表於2024-07-26

使用 Python 進行資料視覺化

1. 簡介

本文件介紹如何使用 Python 進行資料視覺化。我們將涵蓋以下內容:

  • 常見的 Python 視覺化庫
  • 基本圖表型別
  • 圖表定製
  • 案例研究

2. 常見的 Python 視覺化庫

以下是 Python 中常用的資料視覺化庫:

  • Matplotlib: 是 Python 中最基礎和最強大的視覺化庫,提供廣泛的圖表型別和定製選項。
  • Seaborn: 建立在 Matplotlib 之上,提供更高階的統計圖形繪製功能,以改善資料視覺化。
  • Plotly: 提供互動式和動態圖表,使其成為線上和 Web 應用程式的理想選擇。
  • Bokeh: 專注於建立互動式 Web 視覺化,提供類似於 D3.js 的功能。

3. 基本圖表型別

Python 視覺化庫支援多種圖表型別,以下是一些常見的型別:

  • 折線圖: 用於顯示資料隨時間或其他連續變數的變化趨勢。
  • 條形圖: 用於比較不同類別之間的資料。
  • 餅圖: 用於顯示不同部分佔整個資料的比例。
  • 散點圖: 用於顯示兩個變數之間的關係。
  • 直方圖: 用於顯示資料的頻率分佈。

4. 圖表定製

Python 視覺化庫提供了豐富的圖表定製選項,包括:

  • 標題和標籤: 為圖表新增標題和軸標籤。
  • 顏色和樣式: 自定義顏色、線型、標記等。
  • 圖例: 新增圖例以區分不同資料系列。
  • 座標軸: 設定座標軸範圍、刻度和格式。
  • 註釋: 新增文字或圖形註釋以突出顯示重要資訊。

5. 案例研究

5.1 用 Matplotlib 繪製折線圖

import matplotlib.pyplot as plt

# 資料
years = [2010, 2011, 2012, 2013, 2014]
sales = [100, 120, 150, 180, 200]

# 建立折線圖
plt.plot(years, sales)

# 新增標題和軸標籤
plt.title("銷售額趨勢")
plt.xlabel("年份")
plt.ylabel("銷售額")

# 顯示圖表
plt.show()

5.2 用 Seaborn 繪製散點圖

import seaborn as sns
import pandas as pd

# 資料
data = {'x': [1, 2, 3, 4, 5], 'y': [2, 4, 6, 8, 10]}
df = pd.DataFrame(data)

# 建立散點圖
sns.scatterplot(x='x', y='y', data=df)

# 顯示圖表
plt.show()

6. 總結

本文簡要介紹了使用 Python 進行資料視覺化的方法。透過選擇合適的庫和圖表型別,可以有效地呈現和分析資料。希望本文件能夠為您的資料視覺化工作提供幫助。

相關文章