UA MATH563 概率論的數學基礎 中心極限定理5 Renyi定理
UA MATH563 概率論的數學基礎 中心極限定理5 Renyi定理
這是獨立隨機變數及其性質的一個應用,假設 X 1 , ⋯ , X n ∼ i i d F X_1,\cdots,X_n \sim_{iid} F X1,⋯,Xn∼iidF,其中 F F F連續可微。
引理
P
(
X
i
≠
X
j
)
=
1
,
∀
i
≠
j
P(X_i \ne X_j) = 1,\forall i \ne j
P(Xi=Xj)=1,∀i=j
證明 我們來說明
X
,
Y
X,Y
X,Y獨立同分佈於
F
F
F,則
P
(
X
=
Y
)
=
0
P(X=Y)=0
P(X=Y)=0,這個結果非常類似在平面中,直線的Lebesgue測度為0,雖然結論非常直觀,但是我們要處理的對應也是可能取到無窮的,這在分析上會帶來一些困難,但我們可以用truncation技巧,任選一個正數
M
>
0
M>0
M>0,
{
X
=
Y
}
=
{
X
=
Y
,
∣
X
∣
,
∣
Y
∣
≤
M
}
∩
{
X
=
Y
,
∣
X
∣
,
∣
Y
∣
>
M
}
\{X=Y\}=\{X=Y,|X| ,|Y| \le M\} \cap \{X=Y,|X|,|Y|>M\}
{X=Y}={X=Y,∣X∣,∣Y∣≤M}∩{X=Y,∣X∣,∣Y∣>M}
先考慮第二項,根據獨立性
P
(
{
X
=
Y
,
∣
X
∣
,
∣
Y
∣
>
M
}
)
≤
P
(
∣
X
∣
,
∣
Y
∣
>
M
)
=
P
(
∣
X
∣
>
M
)
P
(
∣
Y
∣
>
M
)
=
[
1
−
F
(
M
)
+
F
(
−
M
)
]
2
P(\{X=Y,|X|,|Y|>M\}) \le P(|X|,|Y|>M) \\ = P(|X|>M)P(|Y|>M)=[1-F(M)+F(-M)]^2
P({X=Y,∣X∣,∣Y∣>M})≤P(∣X∣,∣Y∣>M)=P(∣X∣>M)P(∣Y∣>M)=[1−F(M)+F(−M)]2
根據累積分佈函式的性質,當
M
M
M足夠大時,即
∃
δ
>
0
\exists \delta >0
∃δ>0,
∀
M
>
δ
\forall M > \delta
∀M>δ,
F
(
−
M
)
<
ϵ
,
1
−
F
(
M
)
<
ϵ
,
∀
ϵ
>
0
F(-M)<\epsilon,1-F(M)<\epsilon,\forall \epsilon>0
F(−M)<ϵ,1−F(M)<ϵ,∀ϵ>0
下面考慮第一項,對於
∣
X
∣
,
∣
Y
∣
≤
M
|X| ,|Y| \le M
∣X∣,∣Y∣≤M的區域,我們可以把它分解成
(
2
M
n
)
2
(2Mn)^2
(2Mn)2個小區域,並且只有對角線區域,也就是
(
a
/
n
,
(
a
+
1
)
/
n
]
×
(
a
/
n
,
(
a
+
1
)
/
n
]
(a/n,(a+1)/n] \times (a/n,(a+1)/n]
(a/n,(a+1)/n]×(a/n,(a+1)/n],
a
=
−
M
n
,
⋯
,
M
n
a=-Mn,\cdots,Mn
a=−Mn,⋯,Mn這樣的區域才有概率,計算
P
(
X
,
Y
∈
(
a
/
n
,
(
a
+
1
)
/
n
]
×
(
a
/
n
,
(
a
+
1
)
/
n
]
)
=
(
F
(
a
+
1
n
)
−
F
(
a
n
)
)
2
P(X,Y \in (a/n,(a+1)/n] \times (a/n,(a+1)/n]) \\ = (F(\frac{a+1}{n})-F(\frac{a}{n}))^2
P(X,Y∈(a/n,(a+1)/n]×(a/n,(a+1)/n])=(F(na+1)−F(na))2
於是
P
(
X
=
Y
,
∣
X
∣
,
∣
Y
∣
≤
M
)
≤
P
(
⋃
a
(
a
/
n
,
(
a
+
1
)
/
n
]
×
(
a
/
n
,
(
a
+
1
)
/
n
]
)
=
∑
a
=
−
M
n
M
n
(
F
(
a
+
1
n
)
−
F
(
a
n
)
)
2
≤
sup
a
∣
F
(
a
+
1
n
)
−
F
(
a
n
)
∣
∑
a
=
−
M
n
M
n
[
F
(
a
+
1
n
)
−
F
(
a
n
)
)
]
=
sup
a
∣
F
(
a
+
1
n
)
−
F
(
a
n
)
∣
[
F
(
M
)
−
F
(
−
M
)
]
≤
sup
a
∣
F
(
a
+
1
n
)
−
F
(
a
n
)
∣
P(X=Y,|X|,|Y| \le M) \\ \le P(\bigcup_a(a/n,(a+1)/n] \times (a/n,(a+1)/n]) \\ = \sum_{a=-Mn}^{Mn}(F(\frac{a+1}{n})-F(\frac{a}{n}))^2 \\ \le \sup_a|F(\frac{a+1}{n})-F(\frac{a}{n})|\sum_{a=-Mn}^{Mn}[F(\frac{a+1}{n})-F(\frac{a}{n}))] \\ = \sup_a|F(\frac{a+1}{n})-F(\frac{a}{n})|[F(M)-F(-M)] \\ \le \sup_a|F(\frac{a+1}{n})-F(\frac{a}{n})|
P(X=Y,∣X∣,∣Y∣≤M)≤P(a⋃(a/n,(a+1)/n]×(a/n,(a+1)/n])=a=−Mn∑Mn(F(na+1)−F(na))2≤asup∣F(na+1)−F(na)∣a=−Mn∑Mn[F(na+1)−F(na))]=asup∣F(na+1)−F(na)∣[F(M)−F(−M)]≤asup∣F(na+1)−F(na)∣
因為
F
F
F是連續的,事實上連續的累積分佈函式在閉區間上會是一致連續的,所以當
n
n
n足夠大時,
sup
a
∣
F
(
a
+
1
n
)
−
F
(
a
n
)
∣
<
ϵ
\sup_a|F(\frac{a+1}{n})-F(\frac{a}{n})|<\epsilon
asup∣F(na+1)−F(na)∣<ϵ
綜上, P ( X = Y ) = 0 P(X=Y)=0 P(X=Y)=0。
定義 稱 X i X_i Xi是一個record如果 X i > max ( X 1 , ⋯ , X i − 1 ) X_i>\max(X_1,\cdots,X_{i-1}) Xi>max(X1,⋯,Xi−1); X j X_j Xj的rank為 R j = ∑ k = 1 j 1 X i ≥ X j R_j = \sum_{k=1}^j1_{X_i \ge X_j} Rj=∑k=1j1Xi≥Xj,顯然 R j = 1 ⇔ X j i s a r e c o r d R_j=1 \Leftrightarrow X_j\ is\ a\ record Rj=1⇔Xj is a record。
評註 我們可以這樣來理解,假設 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn表示某氣象站在某地一天內進行的 n n n次溫度測量,但實際上該氣象站只需要披露最低溫與最高溫, X i > max ( X 1 , ⋯ , X i − 1 ) X_i>\max(X_1,\cdots,X_{i-1}) Xi>max(X1,⋯,Xi−1)表示 X i X_i Xi是到第 i i i次測量為止的最高溫,於是它形成一個新記錄, R j R_j Rj表示的是到第 j j j次測量為止,第 j j j次測量值的排名,顯然排名為1等價於它是一個新記錄。
Renyi定理
R
1
,
⋯
,
R
n
R_1,\cdots,R_n
R1,⋯,Rn獨立且服從同樣的分佈:
P
(
R
j
=
k
)
=
1
j
,
k
=
1
,
⋯
,
j
P(R_j=k)=\frac{1}{j},k=1,\cdots,j
P(Rj=k)=j1,k=1,⋯,j
評述 定義 A j = { R j = 1 } A_j = \{R_j=1\} Aj={Rj=1}( X j X_j Xj是一個新記錄),Renyi定理說明 1 A 1 , ⋯ , 1 A n 1_{A_1},\cdots,1_{A_n} 1A1,⋯,1An獨立,且 1 A j ∼ B e r ( 1 / j ) 1_{A_j} \sim Ber(1/j) 1Aj∼Ber(1/j),簡單來說也就是第一、二、。。。,n個測量成為新記錄的概率分別是 1 , 1 / 2 , ⋯ , 1 / n 1,1/2,\cdots,1/n 1,1/2,⋯,1/n。
證明
對於
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn,用
X
1
(
w
)
,
⋯
,
X
n
(
w
)
X_1(w),\cdots,X_n(w)
X1(w),⋯,Xn(w)表示一組測量資料(也就是這個隨機變數序列的一個realization),則
X
1
(
w
)
,
⋯
,
X
n
(
w
)
X_1(w),\cdots,X_n(w)
X1(w),⋯,Xn(w)可能有
n
!
n!
n!種次序(其實就是
n
!
n!
n!種排列),因為
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn獨立同分布,我們可以說明每一種排列的可能性相同,下面是一個簡單的思路:
計算某一種順序的概率,比如
X
1
<
X
2
<
⋯
<
X
n
X_1 <X_2 < \cdots < X_n
X1<X2<⋯<Xn,
P
(
X
1
<
X
2
<
⋯
<
X
n
)
=
∫
X
1
<
X
2
<
⋯
<
X
n
d
μ
1
×
μ
2
×
⋯
×
μ
n
P(X_1 <X_2 < \cdots < X_n) = \int_{X_1 <X_2 < \cdots < X_n}d\mu_1 \times \mu_2 \times \cdots \times \mu_n
P(X1<X2<⋯<Xn)=∫X1<X2<⋯<Xndμ1×μ2×⋯×μn
如果交換
X
1
,
X
2
X_1,X_2
X1,X2的次序,
P
(
X
2
<
X
1
<
⋯
<
X
n
)
=
∫
X
2
<
X
1
<
⋯
<
X
n
d
μ
2
×
μ
1
×
⋯
×
μ
n
P(X_2 <X_1 < \cdots < X_n) = \int_{X_2 <X_1 < \cdots < X_n}d\mu_2 \times \mu_1 \times \cdots \times \mu_n
P(X2<X1<⋯<Xn)=∫X2<X1<⋯<Xndμ2×μ1×⋯×μn
因為
X
1
,
X
2
X_1,X_2
X1,X2獨立同分布,
μ
1
=
μ
2
\mu_1=\mu_2
μ1=μ2,所以
d
μ
1
×
μ
2
×
⋯
×
μ
n
=
d
μ
2
×
μ
1
×
⋯
×
μ
n
d\mu_1 \times \mu_2 \times \cdots \times \mu_n=d\mu_2 \times \mu_1 \times \cdots \times \mu_n
dμ1×μ2×⋯×μn=dμ2×μ1×⋯×μn
上面兩個積分割槽域對應的都是
R
n
\mathbb{R}^n
Rn被平均分成
n
!
n!
n!份後的一份,根據對稱性,
P
(
X
1
<
X
2
<
⋯
<
X
n
)
=
P
(
X
2
<
X
1
<
⋯
<
X
n
)
=
1
n
!
P(X_1 <X_2 < \cdots < X_n) = P(X_2 <X_1 < \cdots < X_n)=\frac{1}{n!}
P(X1<X2<⋯<Xn)=P(X2<X1<⋯<Xn)=n!1
對於每一種排列,我們都可以做這個操作,得到相同的概率。
經過簡單觀察,我們可以發現
{
R
1
,
R
2
,
⋯
,
R
n
}
\{R_1,R_2,\cdots,R_n\}
{R1,R2,⋯,Rn}的值與
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn的每一種排列之間是一一對應。比如
R
1
=
1
,
R
2
=
2
,
R
3
=
3
R_1=1,R_2=2,R_3=3
R1=1,R2=2,R3=3對應的排列順序就是
X
1
>
X
2
>
X
3
X_1>X_2>X_3
X1>X2>X3,再比如
R
1
=
1
,
R
2
=
1
,
R
3
=
1
R_1=1,R_2=1,R_3=1
R1=1,R2=1,R3=1對應
X
1
<
X
2
<
X
3
X_1<X_2<X_3
X1<X2<X3。所以
P
(
R
1
=
r
1
,
⋯
,
R
n
=
r
n
)
=
P
(
某
種
排
列
順
序
)
=
1
n
!
P(R_1=r_1,\cdots,R_n=r_n)=P(某種排列順序)=\frac{1}{n!}
P(R1=r1,⋯,Rn=rn)=P(某種排列順序)=n!1
這是
R
1
,
⋯
,
R
n
R_1,\cdots,R_n
R1,⋯,Rn的聯合分佈,下面我們計算每一個
R
j
R_j
Rj的邊緣分佈。
P
(
R
j
=
r
j
)
=
∑
r
1
,
⋯
,
r
j
−
1
,
r
j
+
1
,
⋯
,
r
n
P
(
R
1
=
r
1
,
⋯
,
R
n
=
r
n
)
=
1
×
2
×
⋯
(
j
−
1
)
⋯
(
j
+
1
)
×
⋯
×
n
/
n
!
=
1
j
P(R_j=r_j)=\sum_{r_1,\cdots,r_{j-1},r_{j+1},\cdots,r_n} P(R_1=r_1,\cdots,R_n=r_n) \\ = 1 \times 2 \times \cdots (j-1) \cdots (j+1) \times \cdots \times n/n! = \frac{1}{j}
P(Rj=rj)=r1,⋯,rj−1,rj+1,⋯,rn∑P(R1=r1,⋯,Rn=rn)=1×2×⋯(j−1)⋯(j+1)×⋯×n/n!=j1
因此,我們不難驗證
∏
j
=
1
n
P
(
R
j
=
r
j
)
=
P
(
R
1
=
r
1
,
⋯
,
R
n
=
r
n
)
=
1
n
!
\prod_{j=1}^n P(R_j = r_j) = P(R_1=r_1,\cdots,R_n = r_n) = \frac{1}{n!}
j=1∏nP(Rj=rj)=P(R1=r1,⋯,Rn=rn)=n!1
所以 R 1 , ⋯ , R n R_1,\cdots,R_n R1,⋯,Rn獨立。
相關文章
- UA MATH563 概率論的數學基礎 中心極限定理14 Kolmogorov maximal inequalityH5Go
- UA MATH563 概率論的數學基礎 中心極限定理12 強大數定律 版本2:Etemadi定理H5
- UA MATH563 概率論的數學基礎 中心極限定理23 概率測度族的緊性H5
- UA MATH563 概率論的數學基礎 中心極限定理15 Kolmogorov 0-1律H5Go
- UA MATH563 概率論的數學基礎 中心極限定理7 Kolmogorov extension theorem及其擴充套件H5GoREM套件
- UA MATH563 概率論的數學基礎 中心極限定理6 獨立隨機變數的和與Kolmogorov擴充套件定理H5隨機變數Go套件
- UA MATH563 概率論的數學基礎 中心極限定理8 弱大數定律 Bernstein多項式逼近H5
- UA MATH563 概率論的數學基礎 鞅論初步8 鞅收斂定理H5
- UA MATH563 概率論的數學基礎 中心極限定理4 獨立一元隨機變數的性質H5隨機變數
- UA MATH563 概率論的數學基礎 鞅論初步9 分支過程簡介H5
- 【數學基礎篇】--詳解人工智慧之數學 積分學,概率空間,大數定律和中心極限定理人工智慧
- 大數定律與中心極限定理
- 數論入門基礎(同餘定理/費馬小定理/擴充套件歐幾里德演算法/中國剩餘定理)套件演算法
- 計量經濟學(十五)的理論基礎——時間序列分解定理
- 高等代數理論基礎24:線性方程組有解判別定理
- 數論裡的尤拉定理,試證明
- 大數定理
- 從勾股定理到餘弦相似度-程式設計師的數學基礎程式設計師
- 算數基本定理
- 以測量的角度:從中心極限定理到假設檢驗
- 約數個數定理
- 機器學習數學複習 - 1.概率論基礎機器學習
- 盧卡斯定理(Lucas定理)
- 「管理數學基礎」1.7 矩陣理論:方陣特徵值估計、圓盤定理、譜與譜半徑矩陣特徵
- 「管理數學基礎」3.1 凸分析:凸集與凸集分離定理、Farkas引理
- 矩陣樹定理 BEST 定理矩陣
- [Lucas定理] 集合計數
- 留數定理筆記筆記
- 分散式理論(一) - CAP定理分散式
- “沒有免費的午餐”定理(NFL定理)
- 矩陣樹定理與BEST定理矩陣
- BEST 定理與矩陣樹定理的證明矩陣
- 人工智慧必備數學基礎:概率論與數理統計(2)人工智慧
- 人工智慧必備數學基礎:概率論與數理統計(1)人工智慧
- 約束定理+質數篩
- 二項式定理+數列
- 關於素數定理的證明
- 主定理