十分鐘學習泊松分佈

Candy_GL發表於2019-03-06

原文:https://blog.csdn.net/u011893609/article/details/79168100 

這裡是我的個人網站: 
https://endlesslethe.com/easy-to-learn-poisson-distribution.html 
有更多總結分享,最新更新也只會釋出在我的個人網站上。排版也可能會更好看一點=v=

前言
本文簡述了離散型分佈,闡明瞭泊松分佈的來源,推匯出泊松分佈的公式,列舉了泊松分佈常用的情況,總結了泊松分佈相關數值。
1
離散型分佈概述
離散型分佈包括幾何分佈、超幾何分佈、二項分佈和泊松分佈。其中二項分佈和泊松分佈最重要。

伯努利試驗
對於一個試驗(事件),如果重複發生的概率是獨立地(上一次的結果不影響這次),那麼它是獨立試驗。特別地,如果這個試驗只存在兩種結果,則稱其為伯努利試驗。

隨機變數
對於有現實世界意義的數,我們根據意義的不同,將其劃分為不同的類,而對於同一類的數,都使用同一個隨機變數來稱呼。比如,x年x月x日下雨量,我們就可以使用“隨機變數X”來稱呼;x年x月x日下雨可能性,我們就用“隨機變數Y”來稱呼。

需要明確的是:

隨機變數是一類有相同意義的數,而不是某個數
當使用隨機變數作為一個數時,我們需要指定這個隨機變數。比如“2017年1月25日下雨量”在數學上才是一個具體的值。
隨機變數不一定能用除一一對映以外的方式擬合
幾何分佈
對於重複n次的伯努利試驗,我們可以計算“首次為1是出現在第K次試驗”:Pk=pq(k−1)Pk=pq(k−1) 
如果一個隨機變數X取值1, 2, …, k時對應的值滿足上式,則稱X服從引數為P的幾何分佈,記作X∼G(p)X∼G(p)
超幾何分佈
袋中有N個球,其中m個為紅球,餘下的是白球。從袋中一次取n個球,“恰有k個紅球”的概率: 
Pk=CkmCn−kN−mCnN
Pk=CmkCN−mn−kCNn

對於滿足上式的隨機變數X,稱X服從超幾何分佈,記作X∼H(n,m,N)X∼H(n,m,N)
二項分佈
對於重複n次的伯努利試驗,我們可以計算“成功k次”的概率:Pk=Cknpk(1−p)n−kPk=Cnkpk(1−p)n−k 
對於滿足上式的隨機變數X,稱X滿足二項分佈,即為X∼B(n,p)X∼B(n,p)
01分佈
特別地,當n=1,即只重複一次伯努利試驗時,我們將其稱為01分佈。(隨機變數X只有兩個結果)

泊松分佈的直觀理解
泊松分佈是用來描述某段時間內事件的發生概率。 


我們先假設是從某一時刻起(X=x)的t個單位時間內。我們已知的是單位時間內事件發生的概率p。 
那麼在t個單位時間時事件發生k次的可能性(比如前來看病的人數為k),是滿足二項分佈的: 
Pk=P(X=k)=Cknpk(1−p)n−k
Pk=P(X=k)=Cnkpk(1−p)n−k
通過二項分佈,我們可以計算單位時間的整數倍時刻,事件發生k次的可能性。 
而為了得到第1.2t個單位時間內事件發生的次數,我們需要縮小單位時間,並同等縮小事件發生概率p,比如
tnew=t10,pnew=p10,nnew=n10
tnew=t10,pnew=p10,nnew=n10
故當t取無限小時,可以計算出泊松分佈公式:P(X=k)=λke−λk!P(X=k)=λke−λk! 
λ=npλ=np,為在時間段內事件發生次數的期望。

λλ越大,時間段內事件的平均發生次數會增加。

泊松分佈的公式推導
泊松分佈公式:P(X=k)=λke−λk!P(X=k)=λke−λk! 


泊松分佈的用途
泊松分佈可以作為二項分佈的近似
許多隨機變數服從泊松分佈,如某醫院一天內的就診人數,一段時間內一個網站的登陸人數,某路口一段時間內通過的車輛數
泊松分佈的相關數值
期望:E(X)=λE(X)=λ 
方差:D(X)=λD(X)=λ 
具體推導見參考文獻“泊松分佈的期望和方差推導”

變異係數:Cv=1√λCv=1√λ 
極大似然估計值:λ^=x¯λ^=x¯ 
具體推導見參考文獻“最大似然估計法”

泊松分佈和正態分佈的關係
泊松分佈和正態分佈(高斯分佈)都是由二項分佈推匯出,但基本沒什麼關係…

參考文獻
I. 《概率論與數理統計(第二版)》 陳鴻建著 
II. 泊松分佈和指數分佈:10分鐘教程 
III. 泊松分佈的來源—公式推導—應用 
IV. 泊松分佈(Poisson distribution)的簡單認識 
V. 泊松分佈的期望和方差推導 
VI. 最大似然估計法 
VII. 二項分佈, 泊松分佈和正態分佈之間的關係
 

相關文章