在統計學中機率分佈中的機率密度函式PDF,機率質量PMF,累積分佈CD

mug發表於2021-09-09

一. 概念解釋

PDF:機率密度函式(probability density function), 在數學中,連續型隨機變數的機率密度函式(在不至於混淆時可以簡稱為密度函式)是一個描述這個隨機變數的輸出值,在某個確定的取值點附近的可能性的函式。

PMF : 機率質量函式(probability mass function), 在機率論中,機率質量函式是離散隨機變數在各特定取值上的機率。

CDF : 累積分佈函式 (cumulative distribution function),又叫分佈函式,是機率密度函式的積分,能完整描述一個實隨機變數X的機率分佈。

二. 數學表示

PDF:如果XX是連續型隨機變數,定義機率密度函式為fX(x)fX(x),用PDF在某一區間上的積分來刻畫隨機變數落在這個區間中的機率,即

Pr(a≤X≤b)=∫bafX(x)dxPr(a≤X≤b)=∫abfX(x)dx
PMF:如果XX離散型隨機變數,定義機率質量函式為fX(x)fX(x),PMF其實就是高中所學的離散型隨機變數的分佈律,即  
fX(x)=Pr(X=x)fX(x)=Pr(X=x)
比如對於擲一枚均勻硬幣,如果正面令X=1X=1,如果反面令X=0X=0,那麼它的PMF就是
fX(x)={12 if x∈{0,1}0 if x∉{0,1}fX(x)={12 if x∈{0,1}0 if x∉{0,1}
CDF:不管是什麼型別(連續/離散/其他)的隨機變數,都可以定義它的累積分佈函式,有時簡稱為分佈函式。

對於連續型隨機變數,顯然有
FX(x)=Pr(X≤x)=∫x−∞fX(t)dtFX(x)=Pr(X≤x)=∫−∞xfX(t)dt
那麼CDF就是PDF的積分,PDF就是CDF的導數。
對於離散型隨機變數,其CDF是分段函式,比如舉例中的擲硬幣隨機變數,它的CDF為  
FX(x)=Pr(X≤x)=0 if x

三.概念分析

 根據上述,我們能得到一下結論:

 1)PDF是連續變數特有的,PMF是離散隨機變數特有的;  
 2)PDF的取值本身不是機率,它是一種趨勢(密度)只有對連續隨機變數的取值進行積分後才是機率,也就是說對於連續值確定它在某一點的機率是沒有意義的;  
 3)PMF的取值本身代表該值的機率。

四.分佈函式的意義

  我們從兩點來分析分佈函式的意義:  
    
  1.為什麼需要分佈函式?

  對於離散型隨機變數,可以直接用分佈律來描述其統計規律性,而對於非離散型的隨機變數,如連續型隨機變數,因為我們無法一一列舉出隨機變數的所有可能取值,所以它的機率分佈不能像隨機變數那樣進行描述,於是引入PDF,用積分來求隨機變數落入某個區間的機率。分佈律不能描述連續型隨機變數,密度函式不能描述離散隨機變數,因此需要找到一個統一方式描述隨機變數統計規律,這就有了分佈函式。另外,在現實生活中,有時候人們感興趣的是隨機變數落入某個範圍內的機率是多少,如擲骰子的數小於3點的獲勝,那麼考慮隨機變數落入某個區間的機率就變得有現實意義了,因此引入分佈函式很有必要。
  2. 分佈函式的意義

  分佈函式F(x)F(x)在點xx處的函式值表示XX落在區間(−∞,x](−∞,x]內的機率,所以分佈函式就是定義域為RR的一個普通函式,因此我們可以把機率問題轉化為函式問題,從而可以利用普通的函式知識來研究機率問題,增大了機率的研究範圍。

五:深度理解參考文獻

    
    
    
    
  


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/506/viewspace-2810206/,如需轉載,請註明出處,否則將追究法律責任。

相關文章