NumPy 泊松分佈模擬與 Seaborn 視覺化技巧

小万哥丶發表於2024-05-29

原文網址 : https://www.cnblogs.com/xiaowange/p/18220994

視覺化

泊松分佈

簡介

泊松分佈是一種離散機率分佈，用於描述在給定時間間隔內隨機事件發生的次數。它常用於模擬諸如客戶到達商店、電話呼叫接入中心等事件。

引數

泊松分佈用一個引數來定義：

λ：事件發生的平均速率，表示在單位時間內事件發生的平均次數。

公式

泊松分佈的機率質量函式 (PMF) 給出了在指定時間間隔內發生 k 次事件的機率，計算公式為：

P(k) = e^(-λ) (λ^k) / k!

其中：

e^(-λ)：表示沒有事件發生的機率。
(λ^k)：表示 k 次事件發生的機率。
k!：表示 k 個元素的階乘，即 k × (k - 1) × (k - 2) × ... × 2 × 1。

生成泊松分佈資料

NumPy 提供了 random.poisson() 函式來生成服從泊松分佈的隨機數。該函式接受以下引數：

lam：事件發生的平均速率。
size：輸出陣列的形狀。

示例：生成一個平均速率為 5 的事件在 10 個時間間隔內發生的次數：

import numpy as np

data = np.random.poisson(lam=5, size=10)
print(data)

視覺化泊松分佈

Seaborn 庫提供了便捷的函式來視覺化分佈，包括泊松分佈。

示例：繪製平均速率為 7 的事件在 1000 個時間間隔內發生的次數分佈：

import seaborn as sns
import numpy as np

data = np.random.poisson(lam=7, size=1000)
sns.distplot(data)
plt.show()

正態分佈與泊松分佈的關係

當事件發生的平均速率 λ 很大時，泊松分佈可以近似為正態分佈。其均值 μ 為 λ，標準差 σ 為 sqrt(λ)。

示例：比較泊松分佈和正態分佈的形狀：

import seaborn as sns
import numpy as np

lam = 50

# 生成泊松分佈資料
data_poisson = np.random.poisson(lam=lam, size=1000)

# 生成正態分佈資料
mu = lam
sigma = np.sqrt(lam)
data_normal = np.random.normal(loc=mu, scale=sigma, size=1000)

sns.distplot(data_poisson, label="Poisson")
sns.distplot(data_normal, label="Normal")
plt.legend()
plt.show()

練習

在一個小時內，一家商店平均收到 10 位顧客。模擬顧客到達商店的次數並繪製分佈圖。
比較不同平均速率下泊松分佈形狀的變化。
利用泊松分佈來模擬一個呼叫中心每天接到的電話呼叫數量，並計算平均呼叫量和每天接聽超過 30 個電話的機率。

解決方案

import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

# 1. 模擬顧客到達商店的次數並繪製分佈圖
data = np.random.poisson(lam=10, size=1000)
sns.distplot(data)
plt.show()

# 2. 比較不同平均速率下泊松分佈形狀的變化
lam_values = [5, 10, 20, 50]
for lam in lam_values:
    data = np.random.poisson(lam=lam, size=1000)
    sns.distplot(data, label=f"λ={lam}")
plt.legend()
plt.show()

# 3. 模擬電話呼叫數量並計算平均呼叫量和每天接聽超過 30 個電話的機率
calls_per_day = np.random.poisson(lam=150, size=365)
print("平均呼叫量:", calls_per_day.mean())
print("每天接聽超過 30 個電話的機率:", (calls_per_day > 30).mean())

最後

為了方便其他裝置和平臺的小夥伴觀看往期文章：

微信公眾號搜尋：Let us Coding，關注後即可獲取最新文章推送

看完如果覺得有幫助，歡迎點贊、收藏、關注

NumPy 二項分佈生成與 Seaborn 視覺化技巧
2024-05-27
視覺化
NumPy 均勻分佈模擬及 Seaborn 視覺化教程
2024-05-30
視覺化
NumPy 正態分佈與 Seaborn 視覺化指南
2024-05-23
視覺化
多項分佈模擬及 Seaborn 視覺化教程
2024-06-03
視覺化
NumPy 隨機資料分佈與 Seaborn 視覺化詳解
2024-05-21
隨機視覺化
卡方分佈和 Zipf 分佈模擬及 Seaborn 視覺化教程
2024-06-04
視覺化
如何通俗理解泊松分佈？
2019-03-06
數理統計6：泊松分佈，泊松分佈與指數分佈的聯絡，離散分佈引數估計
2021-02-04
十分鐘學習泊松分佈
2019-03-06
資料統計分析 — 泊松分佈
2023-10-30
概率演算法_二項分佈和泊松分佈
2018-08-24
演算法
資料視覺化Seaborn從零開始學習教程（三）資料分佈視覺化篇
2019-03-01
視覺化
$\Beta$分佈推導與視覺化
2023-04-14
視覺化
Python 視覺化 | Seaborn5 分鐘入門 (五)——lmplot
2020-01-17
Python視覺化
Python 視覺化 | Seaborn5 分鐘入門 (七)——pairplot
2020-01-17
Python視覺化AI
Numpy的Matplotlib視覺化
2020-10-16
視覺化
Python 視覺化 | Seaborn5 分鐘入門 (三)——boxplot 和 violinplot
2020-01-17
Python視覺化
Python 視覺化 | Seaborn5 分鐘入門 (四)——stripplot 和 swarmplot
2020-01-17
Python視覺化Swarm
Python 視覺化 | Seaborn5 分鐘入門 (一)——kdeplot 和 distplot
2020-01-17
Python視覺化
視覺化佈局模組開發分享
2018-10-08
視覺化
Python 視覺化 | Seaborn5 分鐘入門 (六)——heatmap 熱力圖
2020-01-17
Python視覺化
N體模擬資料視覺化 LightningChart®
2021-11-17
視覺化GC
（在模仿中精進資料視覺化04）舊金山街道樹木分佈視覺化
2020-11-22
視覺化
（在模仿中精進資料視覺化07）星球研究所大壩分佈視覺化
2021-01-27
視覺化
泊松過程的詳細理解
2020-12-03
Python Seaborn綜合指南，成為資料視覺化專家
2019-10-22
Python視覺化
全自動化資料洞察！資料分佈對比視覺化！⛵
2022-12-16
視覺化
Pandas資料視覺化工具——Seaborn用法整理
2019-01-30
視覺化
從靜態到動態化，Python資料視覺化中的Matplotlib和Seaborn
2024-03-25
Python視覺化
視覺化影像處理 | 視覺化訓練器 | 影像分類
2024-07-02
視覺化
智駕模擬測試實戰之自動泊車HiL模擬測試
2024-10-09
圖撲 Web 視覺化引擎在模擬分析領域的應用
2022-07-15
Web視覺化
seaborn和pandas-missingno 的資料視覺化--使用畫圖--缺失值分析
2019-01-01
視覺化
Tableau視覺化結果的優化小技巧（二）
2020-11-02
視覺化優化
資料視覺化Seaborn從零開始學習教程（一）風格選擇
2018-05-18
視覺化
Python資料視覺化---pygal模組
2020-04-20
Python視覺化
Python繪圖與視覺化
2020-02-17
Python繪圖視覺化
資料視覺化Seaborn從零開始學習教程（二）顏色調控篇
2019-03-01
視覺化