UA MATH567 高維統計II 隨機向量5 亞高斯隨機向量
UA MATH567 高維統計II 隨機向量5 亞高斯隨機向量
這一講我們將亞高斯分佈推廣到高維。
亞高斯隨機向量
X
X
X是一個
n
n
n維隨機向量,稱
X
X
X是亞高斯隨機向量如果
∀
x
∈
S
n
−
1
\forall x \in S^{n-1}
∀x∈Sn−1,
⟨
X
,
x
⟩
\langle X,x \rangle
⟨X,x⟩是亞高斯隨機變數。其中
S
n
−
1
S^{n-1}
Sn−1是
n
n
n維歐式空間中的單位球面,
S
n
−
1
=
{
x
∈
R
n
:
∥
x
∥
2
=
1
}
S^{n-1}=\{x\in \mathbb{R}^n:\left\|x \right\|_2=1\}
Sn−1={x∈Rn:∥x∥2=1}
亞高斯隨機向量的亞高斯範數
∥
X
∥
ψ
2
=
sup
x
∈
S
n
−
1
∥
⟨
X
,
x
⟩
∥
ψ
2
\left\| X \right\|_{\psi_2}=\sup_{x \in S^{n-1}}\left\| \langle X,x \rangle \right\|_{\psi_2}
∥X∥ψ2=x∈Sn−1sup∥⟨X,x⟩∥ψ2
引理 假設隨機向量
X
X
X的各個分量均是亞高斯、互相獨立且零均值的,則
X
X
X是亞高斯隨機向量,並且存在常數
C
>
0
C>0
C>0
∥
X
∥
ψ
2
≤
C
sup
i
=
1
,
⋯
,
n
∥
X
i
∥
ψ
2
\left\| X \right\|_{\psi_2}\le C\sup_{i=1,\cdots,n}\left\| X_i \right\|_{\psi_2}
∥X∥ψ2≤Ci=1,⋯,nsup∥Xi∥ψ2
證明
∀
x
∈
S
n
−
1
\forall x \in S^{n-1}
∀x∈Sn−1,根據推廣Hoeffding不等式的第一個結論
∥
⟨
X
,
x
⟩
∥
ψ
2
2
=
∥
∑
i
=
1
n
x
i
X
i
∥
ψ
2
2
≤
C
∑
i
=
1
n
∥
x
i
X
i
∥
ψ
2
2
\left\| \langle X,x \rangle \right\|_{\psi_2}^2 = \left\| \sum_{i=1}^n x_iX_i \right\|_{\psi_2}^2 \le C \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2
∥⟨X,x⟩∥ψ22=∥∥∥∥∥i=1∑nxiXi∥∥∥∥∥ψ22≤Ci=1∑n∥xiXi∥ψ22
根據範數的正齊次性,
C
∑
i
=
1
n
∥
x
i
X
i
∥
ψ
2
2
=
C
∑
i
=
1
n
∣
x
i
∣
2
∥
X
i
∥
ψ
2
2
≤
C
∑
i
=
1
n
∣
x
i
∣
2
max
∥
X
i
∥
ψ
2
2
=
C
max
∥
X
i
∥
ψ
2
2
C \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2 = C \sum_{i=1}^n |x_i|^2\left\| X_i \right\|_{\psi_2}^2 \le C \sum_{i=1}^n |x_i|^2\max \left\| X_i \right\|_{\psi_2}^2 \\ = C\max \left\| X_i \right\|_{\psi_2}^2
Ci=1∑n∥xiXi∥ψ22=Ci=1∑n∣xi∣2∥Xi∥ψ22≤Ci=1∑n∣xi∣2max∥Xi∥ψ22=Cmax∥Xi∥ψ22
於是
∥
⟨
X
,
x
⟩
∥
ψ
2
2
≤
C
sup
i
=
1
,
⋯
,
n
∥
X
i
∥
ψ
2
\left\| \langle X,x \rangle \right\|_{\psi_2}^2 \le C\sup_{i=1,\cdots,n}\left\| X_i \right\|_{\psi_2}
∥⟨X,x⟩∥ψ22≤Ci=1,⋯,nsup∥Xi∥ψ2
事實上,在證明的第一步,我們也可以用範數的三角不等式得到:
∥
∑
i
=
1
n
x
i
X
i
∥
ψ
2
2
≤
∑
i
=
1
n
∥
x
i
X
i
∥
ψ
2
2
\left\| \sum_{i=1}^n x_iX_i \right\|_{\psi_2}^2 \le \sum_{i=1}^n\left\| x_iX_i \right\|_{\psi_2}^2
∥∥∥∥∥i=1∑nxiXi∥∥∥∥∥ψ22≤i=1∑n∥xiXi∥ψ22
例 spherical distribution是亞高斯向量
X
∼
U
n
i
f
(
n
S
n
−
1
)
X \sim Unif(\sqrt{n}S^{n-1})
X∼Unif(nSn−1),則
X
X
X是亞高斯向量,且亞高斯範數有界。
證明
假設
g
∼
N
(
0
,
I
n
)
g \sim N(0,I_n)
g∼N(0,In),則
X
=
n
g
∥
g
∥
2
∼
U
n
i
f
(
n
S
n
−
1
)
X = \sqrt{n}\frac{g}{\left\| g \right\|_2} \sim Unif(\sqrt{n}S^{n-1})
X=n∥g∥2g∼Unif(nSn−1),根據對稱性
⟨
X
,
x
⟩
\langle X,x \rangle
⟨X,x⟩具有相同的性質,
∀
x
∈
S
n
−
1
\forall x \in S^{n-1}
∀x∈Sn−1,於是為了簡化討論,我們取
x
=
e
1
x=e_1
x=e1,於是
⟨
X
,
x
⟩
=
X
1
\langle X,x \rangle=X_1
⟨X,x⟩=X1,下面我們計算
P
(
X
1
≥
t
)
=
P
(
n
g
1
∥
g
∥
2
≥
t
)
=
P
(
g
1
∥
g
∥
2
≥
t
n
)
P(X_1 \ge t)=P(\sqrt{n}\frac{g_1}{\left\| g \right\|_2} \ge t)=P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}})
P(X1≥t)=P(n∥g∥2g1≥t)=P(∥g∥2g1≥nt)
定義
E
=
{
∥
g
∥
2
≥
n
2
}
\mathcal{E}=\{\left\| g \right\|_2 \ge \frac{\sqrt{n}}{2} \}
E={∥g∥2≥2n},第一講我們討論過,
∥
g
∥
2
\left\| g \right\|_2
∥g∥2是亞高斯的,於是
P
(
E
C
)
≤
P
(
∣
∥
g
∥
2
−
n
∣
>
n
2
)
≤
2
e
−
c
n
,
∃
c
>
0
P(\mathcal{E}^C) \le P(|\left\| g \right\|_2-\sqrt{n}|>\frac{\sqrt{n}}{2}) \le 2e^{-cn},\exists c>0
P(EC)≤P(∣∥g∥2−n∣>2n)≤2e−cn,∃c>0
計算
P
(
g
1
∥
g
∥
2
≥
t
n
)
=
P
(
g
1
∥
g
∥
2
≥
t
n
,
E
)
+
P
(
g
1
∥
g
∥
2
≥
t
n
,
E
C
)
≤
P
(
g
1
∥
g
∥
2
≥
t
n
,
E
)
+
P
(
E
C
)
≤
P
(
∣
g
1
∣
≥
t
2
)
+
P
(
E
C
)
≤
2
e
−
t
2
8
+
2
e
−
c
n
P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}}) = P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E})+P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E}^C) \\ \le P(\frac{g_1}{\left\| g \right\|_2} \ge \frac{t}{\sqrt{n}},\mathcal{E})+P(\mathcal{E}^C) \le P(|g_1| \ge \frac{t}{2})+P(\mathcal{E}^C) \\ \le 2e^{-\frac{t^2}{8}}+2e^{-cn}
P(∥g∥2g1≥nt)=P(∥g∥2g1≥nt,E)+P(∥g∥2g1≥nt,EC)≤P(∥g∥2g1≥nt,E)+P(EC)≤P(∣g1∣≥2t)+P(EC)≤2e−8t2+2e−cn
第一項使用的是正態分佈的上界,
1
−
Φ
(
t
)
≤
1
2
π
t
e
−
t
2
/
2
1-\Phi(t) \le \frac{1}{\sqrt{2\pi} t}e^{-t^2/2}
1−Φ(t)≤2πt1e−t2/2
下面分類討論:
情況1,假設 t ≤ n t \le \sqrt{n} t≤n,則 e − c n ≤ e − c t 2 e^{-cn} \le e^{-ct^2} e−cn≤e−ct2,於是上面的tail probability是亞高斯的;
情況2,如果 t > n t>\sqrt{n} t>n,則 P ( ∣ X 1 ∣ ≥ t ) = 0 P(|X_1| \ge t)=0 P(∣X1∣≥t)=0,因為 ∣ X 1 ∣ ≤ ∥ X ∥ 2 = 2 |X_1| \le \left\| X \right\|_2=2 ∣X1∣≤∥X∥2=2,上面的tail probability同樣是亞高斯的;
投影極限定理(project limit theorem)
X
∼
U
n
i
f
(
n
S
n
−
1
)
X \sim Unif(\sqrt{n}S^{n-1})
X∼Unif(nSn−1),
∀
x
∈
S
n
−
1
\forall x \in S^{n-1}
∀x∈Sn−1,
⟨
X
,
x
⟩
d
→
N
(
0
,
1
)
,
n
→
∞
\langle X,x \rangle_d \to N(0,1),n \to \infty
⟨X,x⟩d→N(0,1),n→∞
說明
在高維的情況下,正態分佈與spherical distribution有非常緊密的聯絡,上上講我們說明了在高維的情況下,
N
(
0
,
I
n
)
≈
U
n
i
f
(
n
S
n
−
1
)
N(0,I_n)\approx Unif(\sqrt{n}S^{n-1})
N(0,In)≈Unif(nSn−1);這個定理則說明
U
n
i
f
(
n
S
n
−
1
)
Unif(\sqrt{n}S^{n-1})
Unif(nSn−1)沿球面
S
n
−
1
S^{n-1}
Sn−1任意半徑的投影近似服從標準正態分佈。
根據對稱性,我們同樣考慮
X
1
X_1
X1,
X
1
=
n
g
1
∥
g
∥
2
X_1=\sqrt{n}\frac{g_1}{\left\| g \right\|_2}
X1=n∥g∥2g1
根據弱大數定律與依概率收斂的性質,
n
∥
g
∥
2
→
p
1
\frac{\sqrt{n}}{\left\| g \right\|_2} \to_p 1
∥g∥2n→p1
而 g 1 ∼ N ( 0 , 1 ) g_1 \sim N(0,1) g1∼N(0,1),所以 ⟨ X , x ⟩ \langle X,x \rangle ⟨X,x⟩趨近於標準正態分佈。
相關文章
- UA MATH567 高維統計II 隨機向量6 亞高斯隨機向量的應用: 半正定規劃H5隨機
- UA MATH567 高維統計II 隨機向量1 隨機向量的範數H5隨機
- UA MATH567 高維統計II 隨機向量2 各向同性的隨機向量H5隨機
- UA MATH567 高維統計III 隨機矩陣7 亞高斯矩陣的應用:Stochastic Block Model與社群發現 問題描述H5隨機矩陣ASTBloC
- 向量(高階的隨機化應用)隨機
- 隨機向量特徵函式的求法隨機特徵函式
- UA MATH567 高維統計I 概率不等式8 亞指數範數H5
- UA MATH567 高維統計I 概率不等式7 亞指數性與亞指數分佈H5
- 隨機過程(高斯隨機過程、譜分析、白噪聲)隨機
- MATLAB中如何生成指定範圍的隨機整數向量Matlab隨機
- UA MATH567 高維統計I 概率不等式11 Azuma不等式H5
- UA MATH567 高維統計I 概率不等式10 Bernstein不等式H5
- 支援向量機原理(一) 線性支援向量機
- 支援向量機
- 統計學習方法(四) 支撐向量機
- 理解支援向量機
- 計算機程式的思維邏輯 (34) – 隨機計算機隨機
- 計算機程式的思維邏輯 (34) - 隨機計算機隨機
- 隨機之美,隨機森林隨機森林
- CWE-329: 密碼分組連結模式未使用隨機初始化向量密碼模式隨機
- 機器學習:支援向量機(SVM)機器學習
- 機器學習——支援向量機(SVM)機器學習
- c++ 一維向量,和二維向量的基本使用C++
- [Z]Oracle 的隨機數、隨機日期和時間、隨機字串Oracle隨機字串
- java_隨機數(統計例項)Java隨機
- [譯] 支援向量機(SVM)教程
- 機器學習——支援向量機SVM(一)機器學習
- 【機器學習】支援向量機分類機器學習
- 【概率論】一維隨機變數隨機變數
- python生成隨機數、隨機字串Python隨機字串
- Python數模筆記-Sklearn(5)支援向量機Python筆記
- 支援向量機原理(三)線性不可分支援向量機與核函式函式
- 支援向量機原理(二) 線性支援向量機的軟間隔最大化模型模型
- 隨機題隨機
- 隨機排序隨機排序
- 隨機數隨機
- 支援向量機(三)核函式函式
- 【機器學習】支援向量機(個人筆記)機器學習筆記