UA MATH563 概率論的數學基礎 中心極限定理6 獨立隨機變數的和與Kolmogorov擴充套件定理

一個不願透露姓名的孩子發表於2020-12-23

UA MATH563 概率論的數學基礎 中心極限定理6 獨立隨機變數的和的分佈

因為中心極限定理回答的是 n n n個隨機變數的和/均值的極限分佈的問題,所以在考慮漸近結果之前,我們有必要先理解一下如果不考慮極限分佈,有沒有可能計算出當 n n n有限時, n n n個隨機變數的和/均值的極限分佈。

考慮 n = 2 n=2 n=2,假設 X , Y X,Y X,Y獨立,我們試圖分析一下 X + Y X+Y X+Y的分佈:
F X + Y ( z ) = P ( X + Y ≤ z ) = ∫ x + y ≤ z d μ X × μ Y = ∬ 1 ( − ∞ , z ] ( x + y ) d μ X × μ Y = F u b i n i ∬ 1 ( − ∞ , z ] ( x + y ) d μ X d μ Y = ∫ F X ( z − y ) d F Y ( y ) = ∫ F Y ( z − x ) d F X ( x ) F_{X+Y}(z)=P(X+Y \le z) = \int_{x+y \le z} d\mu_X \times \mu_Y \\ = \iint 1_{(-\infty,z]}(x+y)d\mu_X \times \mu_Y \\=_{Fubini}\iint 1_{(-\infty,z]}(x+y)d\mu_X d\mu_Y \\= \int F_X(z-y)dF_Y(y) = \int F_Y(z-x)dF_X(x) FX+Y(z)=P(X+Yz)=x+yzdμX×μY=1(,z](x+y)dμX×μY=Fubini1(,z](x+y)dμXdμY=FX(zy)dFY(y)=FY(zx)dFX(x)

它的密度為
f X + Y ( z ) = ∫ f X ( z − y ) d F Y ( y ) = ∫ f Y ( z − x ) d F X ( x ) = ∫ f X ( z − y ) f Y ( y ) d y = ∫ f Y ( z − x ) f X ( x ) d x f_{X+Y}(z)=\int f_X(z-y)dF_Y(y) = \int f_Y(z-x)dF_X(x) \\ = \int f_X(z-y)f_Y(y)dy = \int f_Y(z-x)f_X(x)dx fX+Y(z)=fX(zy)dFY(y)=fY(zx)dFX(x)=fX(zy)fY(y)dy=fY(zx)fX(x)dx

f X + Y f_{X+Y} fX+Y f X f_X fX f Y f_Y fY的卷積,記為
f X + Y = f X ∗ f Y f_{X+Y} = f_X * f_Y fX+Y=fXfY

評註

  1. 有一些比較特殊的分佈族,分佈族的函式之間的卷積仍然屬於這個分佈族,這樣的分佈族有:Gamma分佈、正態分佈、Poisson分佈、Bernoulli/二項分佈、幾何分佈/負二項分佈等;
  2. 直接計算卷積是比較困難的,通常我們用Fourier變換計算卷積會容易得多,或者在概率論的語境下,即用特徵函式來計算卷積。

應用 在對實際問題進行建模時,我們常常需要用隨機變數,記為 X X X,描述一些複雜的隨機性,這樣的隨機變數通常是沒有辦法寫出密度函式的解析式的,但是我們可以加上一個非常“小”的正態分佈 Y ∼ N ( 0 , ϵ 2 ) Y \sim N(0,\epsilon^2) YN(0,ϵ2),使得 X + Y X+Y X+Y有密度函式的解析式,這樣我們就可以用下面的近似:
f X ( x ) ≈ f X + Y ( x ) f_X(x) \approx f_{X+Y}(x) fX(x)fX+Y(x)


接下來我們考慮 n n n個獨立的隨機變數,關於 n n n個獨立隨機變數我們首要關心的問題並不是它們的分佈如何計算,因為按照 n = 2 n=2 n=2的結果進行類比, n n n個獨立隨機變數的和的密度一定它們密度的卷積,至於如何計算它們的卷積那就是統計計算的問題,而不是概率論的問題了。所以從理論的角度討論 n n n個獨立隨機變數, n ∈ N n \in \mathbb{N} nN,我們真正需要討論的是對任意自然數 n n n,是否真的存在 n n n個互相獨立的隨機變數?這個問題由Kolmogorov extension theorem回答。

我們首先建立一個合適的概率空間 ( Ω , F , P ) (\Omega,\mathcal{F},P) (Ω,F,P)
Ω = R n , F = B ( R n ) P = μ 1 × μ 2 × ⋯ × μ n \Omega = \mathbb{R}^n,\mathcal{F} = \mathcal{B}(\mathbb{R}^n) \\ P = \mu_1 \times \mu_2 \times \cdots \times \mu_n Ω=Rn,F=B(Rn)P=μ1×μ2××μn

其中 μ i \mu_i μi表示第 i i i個概率分佈。然後我們定義隨機變數 X i : Ω → R X_i:\Omega \to \mathbb{R} Xi:ΩR,簡單起見,我們假設 X i X_i Xi是coordinate map,即
X i ( w ) = w i , w = ( w 1 , ⋯   , w i , ⋯   , w n ) X_i(w) = w_i,w = (w_1,\cdots,w_i,\cdots,w_n) Xi(w)=wi,w=(w1,,wi,,wn)

不難驗證 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn就是 n n n個獨立的隨機變數。

但當我們想要進一步延長這個隨機變數序列,問題就比較複雜了,是否存在 { X i } i ≥ 1 \{X_i\}_{i \ge 1} {Xi}i1(無限個隨機變數的序列)使得所有的隨機變數都是獨立的呢?

同樣的,我們先試圖建立概率空間,
Ω = R ∞ = { ( w 1 , w 2 , ⋯   , w i , ⋯   ) , w i ∈ R , i ≥ 1 } F = B ( R ∞ ) = σ ( { A i 1 × ⋯ × A i k , k ≥ 1 } ) \Omega = \mathbb{R}^{\infty} = \{(w_1,w_2,\cdots,w_i,\cdots),w_i \in \mathbb{R},i \ge 1\} \\ \mathcal{F} = \mathcal{B}(\mathbb{R}^{\infty}) = \sigma(\{A_{i_1} \times \cdots \times A_{i_k},k \ge 1\}) Ω=R={(w1,w2,,wi,),wiR,i1}F=B(R)=σ({Ai1××Aik,k1})

其中 A i 1 , ⋯   , A i k A_{i_1},\cdots,A_{i_k} Ai1,,Aik是rectangles。那麼如何在 ( Ω , F ) (\Omega,\mathcal{F}) (Ω,F)上定義概率測度呢?

  • 對於 A i 1 × ⋯ × A i k A_{i_1} \times \cdots \times A_{i_k} Ai1××Aik P ( A i 1 × ⋯ × A i k ) = μ i 1 ( A 1 ) × ⋯ × μ i k ( A k ) P(A_{i_1} \times \cdots \times A_{i_k}) = \mu_{i_1}(A_1) \times \cdots \times \mu_{i_k}(A_k) P(Ai1××Aik)=μi1(A1)××μik(Ak)
  • Kolmogorov extension theorem: 如果在 ( R n , B ( R n ) ) (\mathbb{R}^n,\mathcal{B}(\mathbb{R}^n)) (Rn,B(Rn))上有概率測度 ν n \nu_n νn,且 ν n \nu_n νn是一致的(consistent),即 ν n + 1 ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] × R ) = ν n ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] ) \nu_{n+1}((a_1,b_1] \times \cdots \times (a_n,b_n] \times \mathbb{R})=\nu_n((a_1,b_1] \times \cdots \times (a_n,b_n] ) νn+1((a1,b1]××(an,bn]×R)=νn((a1,b1]××(an,bn])那麼我們可以在可測空間 ( R ∞ , B ( R ∞ ) ) (\mathbb{R}^{\infty},\mathcal{B}(\mathbb{R}^{\infty})) (R,B(R))上構造唯一一個概率測度 P P P,它滿足 P ( { w : w i ∈ ( a i , b i ] , 1 ≤ i ≤ n } ) = ν n ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] ) P(\{w:w_i \in (a_i,b_i],1 \le i \le n\}) = \nu_n((a_1,b_1] \times \cdots \times (a_n,b_n] ) P({w:wi(ai,bi],1in})=νn((a1,b1]××(an,bn])事實上Kolmogorov extension theorem的含義更具有一般性,只是這裡我們應用一下這個定理用來構造無限個獨立的隨機變數。

下面我們用這個思路構造無限個獨立隨機變數。前文我們論述了當 n n n有限時, X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn是獨立的,記它們的分佈為 μ i , 1 ≤ i ≤ n \mu_i,1 \le i \le n μi,1in,定義
ν n = μ 1 × ⋯ × μ n ν n ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] ) = ∏ i = 1 n μ i ( ( a i , b i ] ) \nu_n = \mu_1 \times \cdots \times \mu_n \\ \nu_n((a_1,b_1] \times \cdots \times (a_n,b_n]) = \prod_{i=1}^n \mu_i((a_i,b_i]) νn=μ1××μnνn((a1,b1]××(an,bn])=i=1nμi((ai,bi])

可以驗證 ν n \nu_n νn是一致的概率測度,
ν n + 1 ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] × R ) = ∏ i = 1 n μ i ( ( a i , b i ] ) μ n + 1 ( R ) = ∏ i = 1 n μ i ( ( a i , b i ] ) = ν n ( ( a 1 , b 1 ] × ⋯ × ( a n , b n ] ) \nu_{n+1}((a_1,b_1] \times \cdots \times (a_n,b_n] \times \mathbb{R}) = \prod_{i=1}^n \mu_i((a_i,b_i]) \mu_{n+1}(\mathbb{R}) \\ = \prod_{i=1}^n \mu_i((a_i,b_i]) = \nu_n((a_1,b_1] \times \cdots \times (a_n,b_n]) νn+1((a1,b1]××(an,bn]×R)=i=1nμi((ai,bi])μn+1(R)=i=1nμi((ai,bi])=νn((a1,b1]××(an,bn])

根據Kolmogorov extension theorem,存在唯一一個 P P P ( R ∞ , B ( R ∞ ) ) (\mathbb{R}^{\infty},\mathcal{B}(\mathbb{R}^{\infty})) (R,B(R))上的概率測度,於是定義coordinate map
X i : Ω → R , X i ( w ) = w i , ∀ i ≥ 1 X_i: \Omega \to \mathbb{R},X_i(w) = w_i,\forall i \ge 1 Xi:ΩR,Xi(w)=wi,i1

這就是無限個獨立的隨機變數。

相關文章