UA MATH567 高維統計II 隨機向量5 亞高斯隨機向量

一個不願透露姓名的孩子發表於2020-12-25

UA MATH567 高維統計II 隨機向量5 亞高斯隨機向量

這一講我們將亞高斯分佈推廣到高維。

亞高斯隨機向量 X X X是一個 n n n維隨機向量,稱 X X X是亞高斯隨機向量如果 ∀ x ∈ S n − 1 \forall x \in S^{n-1} xSn1 ⟨ X , x ⟩ \langle X,x \rangle X,x是亞高斯隨機變數。其中 S n − 1 S^{n-1} Sn1 n n n維歐式空間中的單位球面,
S n − 1 = { x ∈ R n : ∥ x ∥ 2 = 1 } S^{n-1}=\{x\in \mathbb{R}^n:\left\|x \right\|_2=1\} Sn1={xRn:x2=1}

亞高斯隨機向量的亞高斯範數
∥ X ∥ ψ 2 = sup ⁡ x ∈ S n − 1 ∥ ⟨ X , x ⟩ ∥ ψ 2 \left\| X \right\|_{\psi_2}=\sup_{x \in S^{n-1}}\left\| \langle X,x \rangle \right\|_{\psi_2} Xψ2=xSn1supX,xψ2

引理 假設隨機向量 X X X的各個分量均是亞高斯、互相獨立且零均值的,則 X X X是亞高斯隨機向量,並且存在常數 C > 0 C>0 C>0
∥ X ∥ ψ 2 ≤ C sup ⁡ i = 1 , ⋯   , n ∥ X i ∥ ψ 2 \left\| X \right\|_{\psi_2}\le C\sup_{i=1,\cdots,n}\left\| X_i \right\|_{\psi_2} Xψ2Ci=1,,nsupXiψ2

證明
∀ x ∈ S n − 1 \forall x \in S^{n-1} xSn1,根據推廣Hoeffding不等式的第一個結論
∥ ⟨ X , x ⟩ ∥ ψ 2 2 = ∥ ∑ i = 1 n x i X i ∥ ψ 2 2 ≤ C ∑ i = 1 n ∥ x i X i ∥ ψ 2 2 \left\| \langle X,x \rangle \right\|_{\psi_2}^2 = \left\| \sum_{i=1}^n x_iX_i \right\|_{\psi_2}^2 \le C \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2 X,xψ22=i=1nxiXiψ22Ci=1nxiXiψ22

根據範數的正齊次性,
C ∑ i = 1 n ∥ x i X i ∥ ψ 2 2 = C ∑ i = 1 n ∣ x i ∣ 2 ∥ X i ∥ ψ 2 2 ≤ C ∑ i = 1 n ∣ x i ∣ 2 max ⁡ ∥ X i ∥ ψ 2 2 = C max ⁡ ∥ X i ∥ ψ 2 2 C \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2 = C \sum_{i=1}^n |x_i|^2\left\| X_i \right\|_{\psi_2}^2 \le C \sum_{i=1}^n |x_i|^2\max \left\| X_i \right\|_{\psi_2}^2 \\ = C\max \left\| X_i \right\|_{\psi_2}^2 Ci=1nxiXiψ22=Ci=1nxi2Xiψ22Ci=1nxi2maxXiψ22=CmaxXiψ22

於是
∥ ⟨ X , x ⟩ ∥ ψ 2 2 ≤ C sup ⁡ i = 1 , ⋯   , n ∥ X i ∥ ψ 2 \left\| \langle X,x \rangle \right\|_{\psi_2}^2 \le C\sup_{i=1,\cdots,n}\left\| X_i \right\|_{\psi_2} X,xψ22Ci=1,,nsupXiψ2

事實上,在證明的第一步,我們也可以用範數的三角不等式得到:
∥ ∑ i = 1 n x i X i ∥ ψ 2 2 ≤ ∑ i = 1 n ∥ x i X i ∥ ψ 2 2 \left\| \sum_{i=1}^n x_iX_i \right\|_{\psi_2}^2 \le \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2 i=1nxiXiψ22i=1nxiXiψ22

spherical distribution是亞高斯向量
X ∼ U n i f ( n S n − 1 ) X \sim Unif(\sqrt{n}S^{n-1}) XUnif(n Sn1),則 X X X是亞高斯向量,且亞高斯範數有界。

證明
假設 g ∼ N ( 0 , I n ) g \sim N(0,I_n) gN(0,In),則 X = n g ∥ g ∥ 2 ∼ U n i f ( n S n − 1 ) X = \sqrt{n}\frac{g}{\left\| g \right\|_2} \sim Unif(\sqrt{n}S^{n-1}) X=n g2gUnif(n Sn1),根據對稱性 ⟨ X , x ⟩ \langle X,x \rangle X,x具有相同的性質, ∀ x ∈ S n − 1 \forall x \in S^{n-1} xSn1,於是為了簡化討論,我們取 x = e 1 x=e_1 x=e1,於是 ⟨ X , x ⟩ = X 1 \langle X,x \rangle=X_1 X,x=X1,下面我們計算
P ( X 1 ≥ t ) = P ( n g 1 ∥ g ∥ 2 ≥ t ) = P ( g 1 ∥ g ∥ 2 ≥ t n ) P(X_1 \ge t)=P(\sqrt{n}\frac{g_1}{\left\| g \right\|_2} \ge t)=P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}}) P(X1t)=P(n g2g1t)=P(g2g1n t)

定義 E = { ∥ g ∥ 2 ≥ n 2 } \mathcal{E}=\{\left\| g \right\|_2 \ge \frac{\sqrt{n}}{2} \} E={g22n }第一講我們討論過, ∥ g ∥ 2 \left\| g \right\|_2 g2是亞高斯的,於是
P ( E C ) ≤ P ( ∣ ∥ g ∥ 2 − n ∣ > n 2 ) ≤ 2 e − c n , ∃ c > 0 P(\mathcal{E}^C) \le P(|\left\| g \right\|_2-\sqrt{n}|>\frac{\sqrt{n}}{2}) \le 2e^{-cn},\exists c>0 P(EC)P(g2n >2n )2ecn,c>0

計算
P ( g 1 ∥ g ∥ 2 ≥ t n ) = P ( g 1 ∥ g ∥ 2 ≥ t n , E ) + P ( g 1 ∥ g ∥ 2 ≥ t n , E C ) ≤ P ( g 1 ∥ g ∥ 2 ≥ t n , E ) + P ( E C ) ≤ P ( ∣ g 1 ∣ ≥ t 2 ) + P ( E C ) ≤ 2 e − t 2 8 + 2 e − c n P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}}) = P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E})+P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E}^C) \\ \le P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E})+P(\mathcal{E}^C) \le P(|g_1| \ge \frac{t}{2})+P(\mathcal{E}^C) \\ \le 2e^{-\frac{t^2}{8}}+2e^{-cn} P(g2g1n t)=P(g2g1n t,E)+P(g2g1n t,EC)P(g2g1n t,E)+P(EC)P(g12t)+P(EC)2e8t2+2ecn

第一項使用的是正態分佈的上界,
1 − Φ ( t ) ≤ 1 2 π t e − t 2 / 2 1-\Phi(t) \le \frac{1}{\sqrt{2\pi} t}e^{-t^2/2} 1Φ(t)2π t1et2/2

下面分類討論:

情況1,假設 t ≤ n t \le \sqrt{n} tn ,則 e − c n ≤ e − c t 2 e^{-cn} \le e^{-ct^2} ecnect2,於是上面的tail probability是亞高斯的;

情況2,如果 t > n t>\sqrt{n} t>n ,則 P ( ∣ X 1 ∣ ≥ t ) = 0 P(|X_1| \ge t)=0 P(X1t)=0,因為 ∣ X 1 ∣ ≤ ∥ X ∥ 2 = 2 |X_1| \le \left\| X \right\|_2=2 X1X2=2,上面的tail probability同樣是亞高斯的;

投影極限定理(project limit theorem)
X ∼ U n i f ( n S n − 1 ) X \sim Unif(\sqrt{n}S^{n-1}) XUnif(n Sn1) ∀ x ∈ S n − 1 \forall x \in S^{n-1} xSn1 ⟨ X , x ⟩ d → N ( 0 , 1 ) , n → ∞ \langle X,x \rangle_d \to N(0,1),n \to \infty X,xdN(0,1),n

說明
在高維的情況下,正態分佈與spherical distribution有非常緊密的聯絡,上上講我們說明了在高維的情況下, N ( 0 , I n ) ≈ U n i f ( n S n − 1 ) N(0,I_n)\approx Unif(\sqrt{n}S^{n-1}) N(0,In)Unif(n Sn1);這個定理則說明 U n i f ( n S n − 1 ) Unif(\sqrt{n}S^{n-1}) Unif(n Sn1)沿球面 S n − 1 S^{n-1} Sn1任意半徑的投影近似服從標準正態分佈。

根據對稱性,我們同樣考慮 X 1 X_1 X1
X 1 = n g 1 ∥ g ∥ 2 X_1=\sqrt{n}\frac{g_1}{\left\| g \right\|_2} X1=n g2g1

根據弱大數定律與依概率收斂的性質,
n ∥ g ∥ 2 → p 1 \frac{\sqrt{n}}{\left\| g \right\|_2} \to_p 1 g2n p1

g 1 ∼ N ( 0 , 1 ) g_1 \sim N(0,1) g1N(0,1),所以 ⟨ X , x ⟩ \langle X,x \rangle X,x趨近於標準正態分佈。

相關文章