如何通俗理解泊松分佈?

Candy_GL發表於2019-03-06

原文:https://blog.csdn.net/ccnt_2012/article/details/81114920 

1 甜在心饅頭店

公司樓下有家饅頭店:

每天早上六點到十點營業,生意挺好,就是發愁一個事情,應該準備多少個饅頭才能既不浪費又能充分供應?

老闆統計了一週每日賣出的饅頭(為了方便計算和講解,縮小了資料):

均值為:

按道理講均值是不錯的選擇(參見如何理解最小二乘法?),但是如果每天準備5個饅頭的話,從統計表來看,至少有兩天不夠賣, 的時間不夠賣:

你“甜在心饅頭店”又不是小米,搞什麼飢餓營銷啊?老闆當然也知道這一點,就拿起紙筆來開始思考。

2 老闆的思考

老闆嘗試把營業時間抽象為一根線段,把這段時間用  來表示:

然後把週一的三個饅頭(“甜在心饅頭”,有褶子的饅頭)按照銷售時間放線上段上:

把  均分為四個時間段:

此時,在每一個時間段上,要不賣出了(一個)饅頭,要不沒有賣出:

在每個時間段,就有點像拋硬幣,要不是正面(賣出),要不是反面(沒有賣出):

 內賣出3個饅頭的概率,就和拋了4次硬幣(4個時間段),其中3次正面(賣出3個)的概率一樣了。

這樣的概率通過二項分佈來計算就是:

但是,如果把週二的七個饅頭放線上段上,分成四段就不夠了:

從圖中看,每個時間段,有賣出3個的,有賣出2個的,有賣出1個的,就不再是單純的“賣出、沒賣出”了。不能套用二項分佈了。

解決這個問題也很簡單,把  分為20個時間段,那麼每個時間段就又變為了拋硬幣:

這樣, 內賣出7個饅頭的概率就是(相當於拋了20次硬幣,出現7次正面):

為了保證在一個時間段內只會發生“賣出、沒賣出”,乾脆把時間切成  份:

越細越好,用極限來表示:

更抽象一點, 時刻內賣出  個饅頭的概率為:

3  的計算

“那麼”,老闆用筆敲了敲桌子,“只剩下一個問題,概率  怎麼求?”

在上面的假設下,問題已經被轉為了二項分佈。二項分佈的期望為:

那麼:

4 泊松分佈

有了 了之後,就有:

我們來算一下這個極限:

其中:

 

所以:

上面就是泊松分佈的概率密度函式,也就是說,在  時間內賣出  個饅頭的概率為:

一般來說,我們會換一個符號,讓  ,所以:

這就是教科書中的泊松分佈的概率密度函式。

5 饅頭店的問題的解決

老闆依然蹙眉,不知道  啊?

沒關係,剛才不是計算了樣本均值:

可以用它來近似:

於是:

畫出概率密度函式的曲線就是:

可以看到,如果每天準備8個饅頭的話,那麼足夠賣的概率就是把前8個的概率加起來:

這樣  的情況夠用,偶爾賣缺貨也有助於品牌形象。

老闆算出一腦門的汗,“那就這麼定了!”

6 二項分佈與泊松分佈

鑑於二項分佈與泊松分佈的關係,可以很自然的得到一個推論,當二項分佈的  很小的時候,兩者比較接近:

7 總結

這個故事告訴我們,要努力學習啊,要不以後饅頭都沒得賣。

生活中還有很多泊松分佈。比如物理中的半衰期,我們只知道物質衰變一半的時間期望是多少,但是因為不確定性原理,我們沒有辦法知道具體哪個原子會在什麼時候衰變?所以可以用泊松分佈來計算。

還有比如交通規劃等等問題。

 

 

相關文章