資料分析---matplotlib模組

tmars發表於2024-06-21

1.摘要

  • 在資料視覺化、統計繪圖和圖表生成領域,Python 被廣泛使用,其中 Matplotlib 是一個極其重要的基礎三方庫。本部落格旨在介紹 Python 及其三方庫 Matplotlib 的詳細資訊,包括 Matplotlib 的安裝步驟、示例程式碼及使用注意事項。

2.引言

2.1 什麼是Matplotlib?

  • Matplotlib 是一個 Python 2D 繪相簿,能生成各種形式的圖表,包括折線圖、柱狀圖、餅圖、散點圖等。Matplotlib 是資料分析和科研繪圖中不可或缺的工具之一,廣泛用於資料展示、分析結果視覺化和報告生成.

2.2 主要特點

  • 多種繪圖型別:支援折線圖、柱狀圖、散點圖、餅圖、直方圖、箱線圖等多種圖表型別
  • 高度可定製:可以對圖表的各個元素進行精細調整和定製
  • 支援多種檔案格式:生成的圖表可以儲存為 PNG, PDF, SVG, EPS 等多種格式
  • 與其他庫的相容性:與 NumPy、Pandas等科學計算庫相容良好

安裝 Matplotlib

3.1 安裝 Matplotlib

  • 可以使用 Python 包管理器 pip 來安裝 Matplotlib:

      pip install matplotlib
    

3.2 驗證安裝

  • 安裝完成後,可以在 Python 環境中匯入 Matplotlib 來驗證安裝是否成功:
    import matplotlib
    print(matplotlib.__version__)
    

4. Matplotlib 示例程式碼

4.1 折線圖

import matplotlib.pyplot as plt

# 資料
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 繪製折線圖
plt.plot(x, y, marker='o')
plt.title("折線圖示例")
plt.xlabel("X軸")
plt.ylabel("Y軸")
plt.grid(True)
plt.show()

4.2 柱狀圖

import matplotlib.pyplot as plt

# 資料
categories = ['A', 'B', 'C', 'D', 'E']
values = [5, 7, 3, 8, 4]

# 繪製柱狀圖
plt.bar(categories, values, color='skyblue')
plt.title("柱狀圖示例")
plt.xlabel("類別")
plt.ylabel("值")
plt.show()

4.3 散點圖

import matplotlib.pyplot as plt

# 資料
x = [5, 7, 8, 7, 2, 17, 2, 9, 4, 11, 12, 9, 6]
y = [99, 86, 87, 88, 100, 86, 103, 87, 94, 78, 77, 85, 86]

# 繪製散點圖
plt.scatter(x, y, color='red')
plt.title("散點圖示例")
plt.xlabel("X軸")
plt.ylabel("Y軸")
plt.show()

4.4 餅圖

import matplotlib.pyplot as plt

# 資料
labels = 'A', 'B', 'C', 'D'
sizes = [15, 30, 45, 10]
explode = (0.1, 0, 0, 0)  # 突出顯示第一個扇區

# 繪製餅圖
plt.pie(sizes, explode=explode, labels=labels, autopct='%1.1f%%',shadow=True, startangle=140)
plt.title("餅圖示例")
plt.show()

4.5 直方圖

import matplotlib.pyplot as plt
import numpy as np

# 生成隨機資料
data = np.random.randn(1000)

# 繪製直方圖
plt.hist(data, bins=30, edgecolor='black', alpha=0.75)
plt.title("直方圖示例")
plt.xlabel("值")
plt.ylabel("頻率")
plt.grid(True)
plt.show()

5.使用注意事項

  • 與其他庫結合使用:Matplotlib 與 NumPy、Pandas 結合使用效果更佳,通常用 Pandas 進行資料處理和分析,再用 Matplotlib 進行視覺化
  • 繪圖樣式:Matplotlib 提供多種繪圖樣式,熟練掌握樣式設定可以使圖表更美觀和專業
  • 檔案格式:生成的圖表可以儲存為多種檔案格式,選擇合適的格式(如 PNG、PDF)以確保圖表的質量和可用性
  • 互動性:Matplotlib 提供了互動式繪圖功能,可以透過 Jupyter Notebook 進行互動式資料視覺化

6.總結

  • Matplotlib 是 Python 資料視覺化和圖表生成的強大工具庫。透過 Matplotlib,開發者可以建立各種型別的圖表,用於資料展示、分析結果視覺化和報告生成。本文介紹了 Matplotlib 庫的安裝、基本使用以及一些重要的注意事項,希望能幫助讀者更好地理解和使用這個強大的工具庫

相關文章