概率論知識總結

ridiculous_dzx發表於2021-01-05


[編輯中,未完]

基本概念

隨機試驗

  • 可以在相同條件下重複進行
  • 每次實驗的可能結果不止一個,並且能事先證明實驗的所有可能
  • 進行一次實驗之前不能確定哪一個結果會出現

樣本空間

將隨機試驗 E E E 的所有可能結果組成的集合稱為 E E E樣本空間,記為 S S S
樣本空間中的元素,即 E E E 的每個結果,稱為 樣本點

隨機事件

稱試驗 E E E 的樣本空間 S S S 的子集為 E E E隨機事件,簡稱 事件
每次試驗,iff 這一子集中的一個樣本點出現時,稱事件發生
有一個樣本點組成的單點集,稱基本事件
樣本空間 S S S 包含所有樣本點,每次試驗中總髮生,稱必然事件
空集 ∅ \varnothing 不包含任何樣本點,每次試驗都不發生,稱不可能事件

事件運算

A ⊂ B A\subset B AB,稱 事件B包含事件A,A發生必導致B發生
A ⊂ B , B ⊂ A A\subset B,B\subset A AB,BA,即 A = B A=B A=B,稱 相等
A ∪ B = { x ∣ x ∈ A   o r   x ∈ B } A\cup B=\{x|x\in A~or~x\in B\} AB={xxA or xB},稱 和事件
A ∩ B = { x ∣ x ∈ A   a n d   x ∈ B } A\cap B=\{x|x\in A~and~x\in B\} AB={xxA and xB},稱 積事件,也記 A B AB AB
A − B = { x ∣ x ∈ A   a n d   x ∉ B } A-B=\{x|x\in A~and~x\notin B\} AB={xxA and x/B} 稱為差事件,A發生B不發生
A ∩ B = ∅ A\cap B=\varnothing AB=,稱 互斥 ,且 A ∪ B = S A\cup B=S AB=S,AB互為 逆事件,又稱 對立事件

  • 滿足定律
    交換律,結合律,分配率
    德摩根定律(De Morgan’s laws) : A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A\cup B}=\overline{A}\cap \overline{B} AB=AB ; A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A\cap B}=\overline{A}\cup \overline{B} AB=AB

頻率

n次實驗中,事件發生次數 n A n_A nA,稱 頻數 n A n \displaystyle \frac{n_A}{n} nnA頻率

概率

E E E 的每一件事 A A A 賦予一個實數,記為 P ( A ) P(A) P(A),稱為事件A的 概率
滿足:非負性;規範性(必然事件 S S S, P ( S ) = 1 P(S)=1 P(S)=1);可列可加性(若 A i A j = ∅ A_iA_j=\varnothing AiAj=,有 P ( ⋃ A i ) = ∑ P ( A i ) P(\bigcup A_i)=\sum P(A_i) P(Ai)=P(Ai)

性質

  1. P ( ∅ ) = 0 P(\varnothing)=0 P()=0
  2. (有限可加性)可列可加性
  3. P ( B − A ) = P ( B ) − P ( A )   ;   P ( B ) ≥ P ( A ) P(B-A)=P(B)-P(A)~;~P(B)\geq P(A) P(BA)=P(B)P(A) ; P(B)P(A)
  4. P ( A ) ≤ 1 P(A)\leq 1 P(A)1
  5. (逆事件) P ( A ‾ ) = 1 − P ( A ) P(\overline{A})=1-P(A) P(A)=1P(A)
  6. (加法公式) P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A\cup B)=P(A)+P(B)-P(AB) P(AB)=P(A)+P(B)P(AB)

等可能(古典)

S S S 包含有限元素,每個事件可能性相同,稱等可能概型(古典概型)(Equally Likely Outcomes Model)

條件概型

在事件 A A A 發生的條件下事件 B B B 發生 ,稱 條件概率(Conditional Probability) P ( B ∣ A ) = P ( A B ) P ( A ) \displaystyle P(B|A)=\frac{P(AB)}{P(A)} P(BA)=P(A)P(AB) (A已發生,B多大可能發生)
可得 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(BA)P(A) (乘法公式)

全概率公式

P ( A ) = P ( A ∣ B ) P ( B ) + P ( A ∣ B ‾ ) P ( B ‾ ) P(A)=P(A|B)P(B)+P(A|\overline{B})P(\overline{B}) P(A)=P(AB)P(B)+P(AB)P(B)
P ( A ) = ∑ P ( A ∣ B i ) P ( B i ) P(A)=\sum P(A|B_i)P(B_i) P(A)=P(ABi)P(Bi)(把每個在不同情況下目標事件發生的概率加起來就是目標事件總的發生概率)(Total Probability)

貝葉斯

P ( B ∣ A ) = P ( A B ) A = P ( A ∣ B ) P ( B ) P ( A ∣ B ) P ( B ) + p ( A ∣ B ‾ ) P ( B ‾ ) \displaystyle P(B|A)=\frac{P(AB)}{A}=\frac{P(A|B)P(B)}{P(A|B)P(B)+p(A|\overline{B})P(\overline{B})} P(BA)=AP(AB)=P(AB)P(B)+p(AB)P(B)P(AB)P(B)

P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ P ( B j ) P ( A ∣ B j ) \displaystyle P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum P(B_j)P(A|B_j)} P(BiA)=P(Bj)P(ABj)P(Bi)P(ABi) (已知結果,問導致這個結果的第 i i i 原因的可能性是多少)(Bayes’ Theorem)
P ( B ) P(B) P(B)為以往資料已知的 先驗概率 P ( B ∣ A ) P(B|A) P(BA)為根據修正後的 後驗概率

獨立

P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),稱 相互獨立(Independents),相互獨立 與 互不相容不能同時成立

  1. P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(BA)=P(B),AB相互獨立
  2. 若AB獨立,則 A − B ‾ , A ‾ − B , A ‾ − B ‾ A-\overline{B},\overline{A}-B,\overline{A}-\overline{B} AB,AB,AB也相互獨立
    一般的,任意 n n n 個事件的積事件等於各事件概率之積,稱相互獨立

隨機變數

  • PDF (Probability Density Function) 概率密度函式 也稱為連續概率分佈 ,記作 f ( x ) f(x) f(x) ,有 $\displaystyle f(x)\geq 0~&\int f(x)=1 $
  • CDF (Cumulative Distribution Function) 累積分佈函式: 記作 F X ( x ) = P ( X ≤ x ) = ∫ − ∞ + ∞ f X ( t ) d t F_X(x)=P(X\leq x)=\displaystyle \int_{-\infty}^{+\infty}f_X(t)dt FX(x)=P(Xx)=+fX(t)dt
  • PMF (Probability Mass Function) 概率質量函式 也稱為離散概率分佈
  • PF (Probability Function) 分佈律

離散型隨機變數

可取值或可列無限多個,稱 離散型隨機變數(Discrete Random Variable)

(0-1)分佈

隨機變數 X X X 只取0或1 , 分佈律為 P { X = k } = p k ( 1 − p ) ( 1 − k ) P\{X=k\}=p^k(1-p)^{(1-k)} P{X=k}=pk(1p)(1k)

伯努利分佈

E E E 只有兩種結果: A , A ‾ A,\overline{A} A,A,稱 E E E伯努利試驗(Bernoulli),將 E E E 獨立重複進行 n n n 次,稱 重伯努利試驗

二項分佈

E E E n n n 重伯努利試驗,每次成功概率為 p p p X X X 代表成功次數,則 X X X 的PF稱 二項分佈(Binomal Distribution),記 X ∽ B ( n , p ) X\backsim B(n,p) XB(n,p)
pmf為: P ( X = k ) = C n k p k ( 1 − p ) ( n − k ) P(X=k)=C_n^kp^k(1-p)^{(n-k)} P(X=k)=Cnkpk(1p)(nk)
伯努利分佈是二項分佈在 n = 1 n=1 n=1 時的特例

泊松分佈

P { X = k } = λ k e − λ k ! , λ > 0 \displaystyle P\{X=k\}=\frac{\lambda^ke^{-\lambda}}{k!},\lambda > 0 P{X=k}=k!λkeλ,λ>0泊松分佈(Poisson Distribution),記作 X ∼ P ( x ) X \sim P(x) XP(x) λ \lambda λ 是單位時間內隨機事件的平均發生次數
泊松分佈適合於描述單位時間內隨機事件發生的次數
泊松分佈的 期望 和 方差 均為 λ \lambda λ

超幾何分佈

從有限 N N N 個物件(其中包含 M M M 個指定種類的物件)中抽出 n n n 個物件,成功抽出該指定種類的物件的次數(不放回),稱 超幾何分佈(Hypergeometic Distribution),記 X ∼ H ( N , M , n ) X \sim H(N,M,n) XH(N,M,n)
隨機抽取 n n n 件產品抽查,發現 k k k 件中不合格的概率為 P ( X = k ) = C M k C N − M m − k C N m \displaystyle P(X=k)=\frac{C_M^kC^{m-k}_{N-M}}{C_N^m} P(X=k)=CNmCMkCNMmk
數學期望為 E X = n M N \displaystyle EX=\frac{nM}{N} EX=NnM

連續隨機變數

對於 X X X 的分佈函式 F ( x ) F(x) F(x),存在非負可積函式 f ( x ) f(x) f(x) ,則稱 X X X連續隨機變數(Continuous Random Variable)

均勻分佈

Uniform Distribution PDF:
f ( x ) = { 1 b − a a < x < b 0 o t h e r w i s e f(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{1}{b-a} &a<x<b\\ &0 &otherwise \end{array} \right. f(x)={ba10a<x<botherwise
記作 X ∼ U ( a , b ) X \sim U(a,b) XU(a,b)
THe CDF is
F ( x ) = ∫ − ∞ x f ( t ) d t = { 0 x < a x − a b − a a ≤ x ≤ b 1 x > b F(x)=\int_{-\infty}^xf(t)dt= \left\{ \begin{array}{l l} 0 &x<a\\ \displaystyle \frac{x-a}{b-a} &a \leq x \leq b\\ 1&x>b \end{array} \right. F(x)=xf(t)dt=0baxa1x<aaxbx>b

指數分佈

Exponential distribution PDF:
f ( x ) = { 1 θ e − x θ x > 0 0 o t h e r w i s e f(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{1}{\theta}e^{-\frac{x}{\theta}} &x>0\\ &0 &otherwise \end{array} \right. f(x)={θ1eθx0x>0otherwise
θ > 0 \theta>0 θ>0 是常數.記作 X ∼ E ( θ ) X \sim E(\theta) XE(θ)
The CDF is:
F ( x ) = { 1 − e − x θ x > 0 0 x > b F(x)= \left\{ \begin{array}{l l} 1-e^{-\frac{x}{\theta}} &x>0\\ 0&x>b \end{array} \right. F(x)={1eθx0x>0x>b
對於 s , t > 0 s,t>0 s,t>0,有 P ( X > s + t ∣ X > s ) = P ( X > t ) P(X>s+t|X>s)=P(X>t) P(X>s+tX>s)=P(X>t) .稱 無記憶性(Memoryless property)

正態分佈

Normal Distribution PDF:
f ( x ) = 1 2 π σ e x p ( − ( x − μ ) 2 2 σ 2 ) f(x)=\displaystyle \frac{1}{\sqrt{2\pi \sigma}}exp(-\displaystyle \frac{(x-\mu)^2}{2\sigma^2}) f(x)=2πσ 1exp(2σ2(xμ)2)
− ∞ < μ < + ∞ , σ > 0 -\infty<\mu<+\infty,\sigma>0 <μ<+,σ>0 是常數.記作 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2)
第一引數 μ \mu μ 是服從正態分佈的隨機變數的均值,描述位置引數,描述正態分佈的集中趨勢位置
第二個引數 σ 2 \sigma^2 σ2 是此隨機變數的方差,描述離散程度,越大越分散越扁平
影像關於 x = μ x=\mu x=μ 對稱,有 h > 0 h>0 h>0, P ( μ − h < X ≤ μ ) = P ( μ < x ≤ μ + h ) P(\mu-h<X\leq \mu)=P(\mu <x\leq\mu+h) P(μh<Xμ)=P(μ<xμ+h)
x = μ x=\mu x=μ 有最大值 f ( μ ) = 1 2 π σ f(\mu)=\displaystyle \frac{1}{\sqrt{2\pi\sigma}} f(μ)=2πσ 1
σ \sigma σ 越小圖形約尖
μ = 0 , σ = 1 \mu=0,\sigma=1 μ=0,σ=1 時,為 標準正態分佈(standard normal distribution)

  • 通過線性變換,將一般正態分佈變換為標準正態分佈 Z = X − μ σ ∼ N ( 0 , 1 ) Z=\displaystyle \frac{X-\mu}{\sigma} \sim N(0,1) Z=σXμN(0,1)

對於標準正態隨機變數,若 z α z_\alpha zα 滿足 P ( X > z α ) = α ( 0 < α < 1 ) P(X>z_\alpha)=\alpha(0<\alpha<1) P(X>zα)=α(0<α<1) ,稱 α \alpha α 分位點

多維隨機變數

( X , Y ) (X,Y) (X,Y) 是二維隨機變數,對於 F ( X , Y ) = P { ( X ≤ x ) ∩ ( Y ≤ y ) } F(X,Y)=P\{(X\leq x) \cap (Y\leq y)\} F(X,Y)=P{(Xx)(Yy)} X Y XY XY聯合分佈函式(Joint Distribution Function),稱 P ( X = x i , Y = y i ) = P i j P(X=x_i,Y=y_i)=P_{ij} P(X=xi,Y=yi)=Pij聯合分佈律
存在可積函式有 F ( x , y ) = ∫ ∫ f ( x , y ) d x d y \displaystyle F(x,y)=\int \int f(x,y)dxdy F(x,y)=f(x,y)dxdy,則稱 ( X , Y ) (X,Y) (X,Y)連續型二維隨機變數 f ( x , y ) f(x,y) f(x,y)聯合密度函式

邊緣分佈

有二維隨機變數 ( X , Y ) (X,Y) (X,Y) X X X Y Y Y 各自有分佈函式,分別記作 F X ( x ) , F Y ( y ) F_X(x),F_Y(y) FX(x),FY(y),稱 邊緣分佈函式(Marginal Distribution),稱 f X ( x ) , f Y ( y ) f_X(x),f_Y(y) fX(x),fY(y)邊緣密度函式()
( y → ∞ ) (y \rightarrow \infty) (y) F X ( x ) = P ( X ≤ x ) = P ( X ≤ x , Y < ∞ ) = F ( x , ∞ ) F_X(x)=P(X \leq x)=P(X\leq x,Y<\infty)=F(x,\infty) FX(x)=P(Xx)=P(Xx,Y<)=F(x,),同理 F Y ( y ) = F ( ∞ , y ) F_Y(y)=F(\infty,y) FY(y)=F(,y)

  • F X ( x ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( x , y ) d y ] d x \displaystyle F_X(x)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}f(x,y)dy]dx FX(x)=x[+f(x,y)dy]dx
  • F Y ( y ) = ∫ − ∞ y [ ∫ − ∞ + ∞ f ( x , y ) d x ] d y \displaystyle F_Y(y)=\int_{-\infty}^{y}[\int_{-\infty}^{+\infty}f(x,y)dx]dy FY(y)=y[+f(x,y)dx]dy
  • f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y \displaystyle f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy fX(x)=+f(x,y)dy
  • f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x \displaystyle f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx fY(y)=+f(x,y)dx

條件分佈

對於固定的 j j j P ( X = x i ∣ Y = y j ) = P ( X = x i , Y = y j ) P ( Y = y j ) = p i j p j \displaystyle P(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_j} P(X=xiY=yj)=P(Y=yj)P(X=xi,Y=yj)=pjpij 為在 Y = y j Y=y_j Y=yj 條件下 X X X 的條件分佈律
對於固定的 y y y f Y ( y ) > 0 f_Y(y)>0 fY(y)>0 ,則稱 f ( x , y ) f Y ( y ) \displaystyle \frac{f(x,y)}{f_Y(y)} fY(y)f(x,y) Y = y Y=y Y=y 條件下 X X X條件概率密度,記為 f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X|Y}(x|y)=\displaystyle \frac{f(x,y)}{f_Y(y)} fXY(xy)=fY(y)f(x,y) ,稱 ∫ − ∞ x f X ∣ Y ( x ∣ y ) d x = ∫ − ∞ x f ( x , y ) f Y ( y ) \displaystyle \int_{-\infty}^{x}f_{X|Y}(x|y)dx=\int_{-\infty}^{x}\frac{f(x,y)}{f_Y(y)} xfXY(xy)dx=xfY(y)f(x,y) Y = y Y=y Y=y 條件下 X X X 的條件分佈函式

  • 若有 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y) ,即 P ( X ≤ x , Y ≤ y ) = P ( X ≤ x ) P ( Y ≤ y ) P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y) P(Xx,Yy)=P(Xx)P(Yy)相互獨立

兩個隨機變數的函式分佈

  • Z = X + Y Z=X+Y Z=X+Y

The PDF is f X + Y ( z ) = f Z ( z ) = ∫ − ∞ + ∞ f ( x , z − x ) d x = ∫ − ∞ + ∞ f ( z − y , x ) d y \displaystyle f_{X+Y}(z)=f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,x)dy fX+Y(z)=fZ(z)=+f(x,zx)dx=+f(zy,x)dy
The CDF is F Z ( z ) = P ( Z ≤ z ) = ∬ x + y ≤ z f ( x , y ) d x d y \displaystyle F_Z(z)=P(Z\leq z)=\iint_{x+y\leq z}f(x,y)dxdy FZ(z)=P(Zz)=x+yzf(x,y)dxdy

  • Z = X Y \displaystyle Z=\frac{X}{Y} Z=YX
  • Z = X Y Z=XY Z=XY
  • M = max ⁡ { X , Y }   &   N = min ⁡ { X , Y } M=\max\{X,Y\}~\&~N=\min\{X,Y\} M=max{X,Y} & N=min{X,Y}

數字特徵

期望

離散 隨機變數 X X X 的分佈律為 P ( X = x k ) = p k P(X=x_k)=p_k P(X=xk)=pk ,若級數 ∑ x k p k \displaystyle \sum x_kp_k xkpk 絕對收斂,稱其和為 X X X數學期望(expectation),記 E ( X ) E(X) E(X)
連續 隨機變數 X X X 的PDF為 f ( x ) f(x) f(x),若積分 ∫ x f ( x ) d x \displaystyle \int xf(x)dx xf(x)dx 絕對收斂,則為數學期望。

  • (0-1)分佈期望:
  • 二項分佈期望:
  • 泊松分佈期望:
    滿足性質:
  • E C = C EC=C EC=C
  • E ( C X ) = C E ( X ) E(CX)=CE(X) E(CX)=CE(X)
  • E ( X + Y ) = E X + E Y E(X+Y)=EX+EY E(X+Y)=EX+EY
  • KaTeX parse error: Undefined control sequence: \* at position 9: E(XY)=EX\̲*̲EY 當相互獨立

方差

E { [ X − E ( X ) ] 2 } E\{[X-E(X)]^2\} E{[XE(X)]2} X X X 的方差,記為 D ( X ) D(X) D(X) V a r ( X ) Var(X) Var(X)
對於 離散 變數,有 D ( X ) = ∑ [ x k − E ( X ) 2 ] p k \displaystyle D(X)=\sum [x_k-E(X)^2]p_k D(X)=[xkE(X)2]pk ,對於 連續 變數 D ( X ) = ∫ [ x − E ( X ) ] 2 f ( x ) \displaystyle D(X)=\int [x-E(X)]^2f(x) D(X)=[xE(X)]2f(x)
公式: D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E(X^2)-[E(X)]^2 D(X)=E(X2)[E(X)]2
E ( X ) = μ , D ( X ) = σ 2 E(X)=\mu,D(X)=\sigma^2 E(X)=μ,D(X)=σ2,記 X ∗ = X − μ σ \displaystyle X^*=\frac{X-\mu}{\sigma} X=σXμ標準化變數

  • ???

滿足性質:

  • D ( C ) = 0 D(C)=0 D(C)=0
  • D ( C X ) = C 2 D ( X ) , D ( X + C ) = D ( X ) D(CX)=C^2D(X),D(X+C)=D(X) D(CX)=C2D(X),D(X+C)=D(X)
  • D ( X + Y ) = D ( X ) + D ( Y ) + 2 E { ( X − E ( X ) ) ( E − E ( Y ) ) } D(X+Y)=D(X)+D(Y)+2E\{(X-E(X))(E-E(Y))\} D(X+Y)=D(X)+D(Y)+2E{(XE(X))(EE(Y))},當相互獨立有 D ( X + Y ) = D ( X ) + D ( Y ) D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y)
  • P ( X = E ( X ) ) = 1 P(X=E(X))=1 P(X=E(X))=1

引入 D ( X ) \sqrt{D(X)} D(X) 記為 σ ( X ) \sigma (X) σ(X),稱為 標準差 或均方差

協方差

定義 C o v ( X , Y ) = E ( [ X − E ( X ) ] [ Y − E ( Y ) ] ) Cov(X,Y)=E([X-E(X)][Y-E(Y)]) Cov(X,Y)=E([XE(X)][YE(Y)])協方差(Covariance)
易得 C o v ( X , Y ) = C o v ( Y , X )    ,    C o v ( X , X ) = D ( X ) Cov(X,Y)=Cov(Y,X)~~,~~Cov(X,X)=D(X) Cov(X,Y)=Cov(Y,X)  ,  Cov(X,X)=D(X)展開定義有 C o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X,Y)=E(XY)-E(X)E(Y) Cov(X,Y)=E(XY)E(X)E(Y)
有性質:

  • C o v ( a X , b Y ) = a b C o v ( X , Y ) Cov(aX,bY)=abCov(X,Y) Cov(aX,bY)=abCov(X,Y)
  • C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)

相關係數

ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) \displaystyle \rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} ρXY=D(X) D(Y) Cov(X,Y)相關係數(Correlation Coefficient)
∣ ρ X Y ∣ < 1 |\rho_{XY}|<1 ρXY<1 P ( Y = a + b X ) = 1 P(Y=a+bX)=1 P(Y=a+bX)=1
(引入 均方誤差 e = E [ ( Y − ( a + b X ) ) 2 ] = ( 1 − ρ X Y 2 ) D ( Y ) e=E[(Y-(a+bX))^2]=(1-\rho^2_{XY})D(Y) e=E[(Y(a+bX))2]=(1ρXY2)D(Y)
∣ ρ X Y ∣ |\rho_{XY}| ρXY 較大時, e e e 較小, X , Y X,Y X,Y 線性關係較緊密,線性相關程度較大,當 ∣ ρ X , Y ∣ = 0 |\rho_{X,Y}|=0 ρX,Y=0,稱 不相關

協方差矩陣

E ( X k ) E(X^k) E(Xk) 存在,稱 k k k 階原點矩,簡稱 k階矩
E ( X k Y l ) E(X^kY^l) E(XkYl)存在,稱 k + l k+l k+l 階混合矩
E ( [ X − E ( X ) ] k [ Y − E ( Y ) ] l ) E([X-E(X)]^k[Y-E(Y)]^l) E([XE(X)]k[YE(Y)]l) 存在,稱 k + l k+l k+l 階混合中心矩
顯然期望為一階原點矩,方差是二階中心矩,協方差是二階混合中心矩
c i j = C o v ( X i , X j ) = E ( [ X i − E ( X i ) ] [ X j − E ( X j ) ] ) c_{ij}=Cov(X_i,X_j)=E([X_i-E(X_i)][X_j-E(X_j)]) cij=Cov(Xi,Xj)=E([XiE(Xi)][XjE(Xj)]) 存在,則 C \mathbf{C} C協方差矩陣

大數定理 & \& & 中心極限

簡單而言,大數定律講的是樣本均值收斂到總體均值(就是期望),而中心極限定理告訴我們,當樣本量足夠大時,樣本均值的分佈慢慢變成正態分佈
X i X_i Xi 相互獨立

切比雪夫大數定律

若存在常數 C C C 使得 D ( X k ) ≤ C D(X_k)\leq C D(Xk)C 則對於任意小的正數 ϵ \epsilon ϵ ,滿足
lim ⁡ n → ∞ P { ∣ 1 n ∑ x k − 1 n ∑ E x k ∣ < ϵ } = 1 \displaystyle \lim_{n\rightarrow \infty} P\{ |\frac{1}{n}\sum x_k-\frac{1}{n}\sum Ex_k|<\epsilon \}=1 nlimP{n1xkn1Exk<ϵ}=1
數學意義:算數平均值依概率收斂於數學期望;隨著樣本容量n的增加,樣本平均數將接近於總體平均數。

伯努利大數定律

f A f_A fA n n n 次重伯努利試驗中事件發生次數, p p p 是發生概率,對於任意小的正數 ϵ \epsilon ϵ ,滿足
lim ⁡ n → ∞ P { ∣ f A n − p ∣ < ϵ } = 1   o r   0 \displaystyle \lim_{n\rightarrow \infty} P\{|\frac{f_A}{n}-p|<\epsilon\}=1~or~0 nlimP{nfAp<ϵ}=1 or 0
數學意義:頻率依概率收斂於統計概率

辛欽大數定

律服從同一分佈,且具有數學期望 E ( X k ) = μ E(X_k)=\mu E(Xk)=μ ,作前 n n n 個變數的算術平均 1 n ∑ X k \displaystyle \frac{1}{n}\sum X_k n1Xk
lim ⁡ n → ∞ P { ∣ 1 n ∑ X k − μ ∣ < ϵ } = 1 \displaystyle\lim_{n\rightarrow \infty}P\{|\frac{1}{n}\sum X_k-\mu|<\epsilon\}=1 nlimP{n1Xkμ<ϵ}=1
數學意義:算數平均值穩定於數學期望的確切解釋

馬爾可夫不等式

X X X 為一非負隨機變數,則 P ( X ≥ a ) ≤ E X a \displaystyle P(X\geq a)\leq \frac{EX}{a} P(Xa)aEX,稱 馬爾可夫不等式(Markov inequality)

切比雪夫不等式

存在 ϵ \epsilon ϵ,s.t. P ( ∣ X − μ ∣ ≥ ϵ ) ≤ σ 2 ϵ 2 \displaystyle P(|X-\mu|\geq \epsilon)\leq\frac{\sigma^2}{\epsilon^2} P(Xμϵ)ϵ2σ2,稱 切比雪夫不等式(chebyshev’s inequality)

獨立同分布的 Levi-Lindeberg \textit{Levi-Lindeberg} Levi-Lindeberg中心極限定理

設隨機變數相互獨立且具有數學期望 E ( x k ) = μ , D ( X k ) = σ 2 E(x_k)=\mu,D(X_k)=\sigma^2 E(xk)=μ,D(Xk)=σ2 則隨機變數之和 ∑ X k \sum X_k Xk的標準化變數
Y n = ∑ X k − E ( ∑ X k ) D ( ∑ X k ) = ∑ X k − n μ n σ \displaystyle Y_n=\frac{\sum X_k-E(\sum X_k)}{\sqrt{D(\sum X_k)}}=\frac{\sum X_k-n\mu }{\sqrt{n}\sigma} Yn=D(Xk) XkE(Xk)=n σXknμ
的PDF F n ( x ) F_n(x) Fn(x)對於任意 x x x 滿足
lim ⁡ n → ∞ F n ( x ) = lim ⁡ n → ∞ P { ∑ X k − n μ n σ ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t \displaystyle \lim_{n\rightarrow \infty}F_n(x)=\lim_{n\rightarrow \infty} P\{\frac{\sum X_k-n\mu}{\sqrt{n}\sigma}\leq x\}=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt nlimFn(x)=nlimP{n σXknμx}=x2π 1et2/2dt
n n n 足夠大的時候,可以把任何一個期望方差存在的分佈,搞成一個正態分佈

De   Moivre-Laplace \textit{De Moivre-Laplace} De Moivre-Laplace定理

De Moivre-Laplace 定理其實就是 Levi-Lindeberg 的特殊情況。
η n ∼ B ( n , p ) \eta_n \sim B(n,p) ηnB(n,p) ,有
lim ⁡ n → ∞ P { η n − n p n p ( 1 − p ) ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t = Φ ( x ) \displaystyle \lim_{n\rightarrow \infty}P\{\frac{\eta_n-np}{\sqrt{np(1-p)}}\leq x\}=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt=\Phi(x) nlimP{np(1p) ηnnpx}=x2π 1et2/2dt=Φ(x)
實際就是在把一個二項分佈,嘗試轉為正態分佈去研究;正態分佈是二項分佈的極限分佈。

抽樣分佈

隨機樣本

總體:實驗全部可能的觀察值
個體:每一個可能的觀察值
容量:總體中所包含的個體數
有限/無限總體:容量有限/無限
D e f : Def: Def: X X X 是具有分佈函式 F F F 的隨機變數,若 X i X_i Xi 是具有相同 F F F ,相互獨立的隨機變數,則稱 X i X_i Xi 為從 F F F (或總體 F F F ,或總體 X X X)得到的容量為 n n n 的簡單隨機樣本,簡稱樣本,觀察值 x i x_i xi樣本值,又稱為 X X X n n n獨立的觀察值
由定義得:若 X i X_i Xi F F F 的一個樣本,則相互獨立。所以PDF為 ∏ F ( x i ) \displaystyle \prod F(x_i) F(xi) ,CDF為 ∏ f ( x i ) \displaystyle \prod f(x_i) f(xi)

直方圖和箱線圖

抽樣分佈

X i X_i Xi 是一個樣本, g ( X i ) g(X_i) g(Xi) X i X_i Xi 的一個函式,則稱 g ( X i ) g(X_i) g(Xi) 是一個 統一量

定義觀察值
樣本平均值 X ‾ = 1 n ∑ X i \displaystyle \overline{X}=\frac{1}{n}\sum X_i X=n1Xi x ‾ = 1 n ∑ x i \displaystyle \overline{x}=\frac{1}{n}\sum x_i x=n1xi
樣本方差 S 2 = 1 n − 1 ∑ ( X i − X ‾ ) 2 = 1 n − 1 ( ∑ ∗ X i − n X ‾ ) 2 \displaystyle S^2=\frac{1}{n-1}\sum (X_i-\overline{X})^2=\frac{1}{n-1}(\sum *X_i-n\overline{X})^2 S2=n11(XiX)2=n11(XinX)2 s 2 = 1 n − 1 ∑ ( x i − x ‾ ) 2 = 1 n − 1 ( ∑ x i 2 − n x ‾ 2 ) \displaystyle s^2=\frac{1}{n-1}\sum(x_i-\overline{x})^2=\frac{1}{n-1}(\sum x_i^2-n\overline{x}^2) s2=n11(xix)2=n11(xi2nx2)
樣本標準差 S = S 2 \displaystyle S=\sqrt{S^2} S=S2 s = s 2 s=\sqrt{s^2} s=s2
樣本 k k k 階(原點)矩: A k = 1 n ∑ X i k \displaystyle A_k=\frac{1}{n}\sum X_i^k Ak=n1Xik a k = 1 n ∑ x i k \displaystyle a_k=\frac{1}{n}\sum x_i^k ak=n1xik
樣本 k k k 階中心矩 B k = 1 n ∑ ( X i − X ‾ ) k \displaystyle B_k=\frac{1}{n}\sum (X_i-\overline{X})^k Bk=n1(XiX)k b k = 1 n ∑ ( x i − x ‾ ) k \displaystyle b_k=\frac{1}{n}\sum(x_i-\overline{x})^k bk=n1(xix)k

定義 經驗分佈函式 ,用 S ( x ) S(x) S(x) 表示 X i X_i Xi 中不大於 x x x 的隨機變數個數。經驗分佈函式 F n = 1 n S ( x ) \displaystyle F_n=\frac{1}{n}S(x) Fn=n1S(x)

χ 2 \chi^2 χ2 分佈

X i X_i Xi 是來自總體 N ( 0 , 1 ) N(0,1) N(0,1) 的樣本,則稱統計量 χ 2 = ∑ X i 2 \displaystyle \chi^2=\sum X_i^2 χ2=Xi2 服從自由度為 n n n χ 2 \chi^2 χ2分佈,記作 χ 2 ∼ χ 2 ( n ) \chi^2 \sim \chi^2(n) χ2χ2(n)自由度 指包含獨立變數個數,PDF為
f ( x ) = { 1 2 n / 2 Γ ( n / 2 ) y n / 2 − 1 e − − y 2 y > 0 0 o t h e r w i s e f(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{1}{2^{n/2}\Gamma(n/2)}y^{n/2-1}e^{-\frac{-y}{2}} &y>0\\ &0 &otherwise \end{array} \right. f(x)=2n/2Γ(n/2)1yn/21e2y0y>0otherwise

  • 可加性
    χ 1 2 ∼ χ 2 ( n ) , χ 2 2 ∼ χ 2 ( n ) \chi^2_1\sim \chi^2(n),\chi_2^2\sim \chi^2(n) χ12χ2(n),χ22χ2(n),並且相互獨立,則有 χ 1 2 + χ 2 2 ∼ χ 2 ( n 1 + n 2 ) \chi^2_1+\chi^2_2\sim \chi^2(n_1+n_2) χ12+χ22χ2(n1+n2)
  • 數學期望和方差
    E ( χ 2 ) = n , D ( χ 2 ) = 2 n E(\chi^2)=n,D(\chi^2)=2n E(χ2)=n,D(χ2)=2n
  • 分位點
    ???

t t t 分佈

X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) X\sim N(0,1),Y\sim \chi^2(n) XN(0,1),Yχ2(n),且相互獨立,則稱 t = X Y / n \displaystyle t=\frac{X}{\sqrt{Y/n}} t=Y/n X 服從自由度為 n n nt分佈,記作 t ∼ t ( n ) t\sim t(n) tt(n)又稱 學生氏(Student)分佈,PDF為
h ( t ) = Γ [ ( n + 1 ) / 2 ] π n Γ ( n / 2 ) ( 1 + t 2 n ) − ( n + 1 ) / 2 \displaystyle h(t)=\frac{\Gamma[(n+1)/2]}{\sqrt{\pi n}\Gamma(n/2)}(1+\frac{t^2}{n})^{-(n+1)/2} h(t)=πn Γ(n/2)Γ[(n+1)/2](1+nt2)(n+1)/2

  • 分位點

F F F 分佈

U ∼ χ 2 ( n 1 ) , V ∼ χ 2 ( n 2 ) U\sim \chi^2(n_1),V\sim \chi^2(n_2) Uχ2(n1),Vχ2(n2)且相互獨立,則稱 F = U / n 1 V / n 2 \displaystyle F=\frac{U/n_1}{V/n_2} F=V/n2U/n1 服從自由度為 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F 分佈,記作 F ∼ F ( n 1 , n 2 ) F\sim F(n_1,n_2) FF(n1,n2),PDF為
ψ ( x ) = { Γ [ ( n 1 + n 2 ) / 2 ] ( n 1 / n 2 ) n 1 / 2 y ( n 1 / 2 ) − 1 Γ ( n 1 / 2 ) Γ ( n 2 / 2 ) [ 1 + ( n 1 y / n 2 ) ] ( n 1 + n 2 ) / 2 y > 0 0 o t h e r w i s e \psi(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{\Gamma[(n_1+n_2)/2](n_1/n_2)^{n_1/2}y^{(n_1/2)-1}}{\Gamma(n_1/2)\Gamma(n_2/2)[1+(n_1y/n_2)]^{(n_1+n_2)/2}} &y>0\\ &0 &otherwise \end{array} \right. ψ(x)=Γ(n1/2)Γ(n2/2)[1+(n1y/n2)](n1+n2)/2Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)10y>0otherwise
可知,若 F ∼ F ( n 1 , n 2 ) F\sim F(n_1,n_2) FF(n1,n2),則 1 F ∼ F ( n 2 , n 1 ) \displaystyle \frac{1}{F}\sim F(n_2,n_1) F1F(n2,n1)

  • 分位點

樣本方差的分佈

正態總體的樣本均值

X i X_i Xi 是來自正態總體 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) 的樣本, X ‾ \overline{X} X 是樣本均值, S 2 S^2 S2 是樣本方差。則

  • X ‾ ∼ N ( μ , σ 2 / n ) \overline{X}\sim N(\mu,\sigma^2/n) XN(μ,σ2/n)
  • ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \displaystyle \frac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) σ2(n1)S2χ2(n1) X ‾ \overline{X} X S 2 S^2 S2 相互獨立
  • X ‾ − μ S / n ∼ t ( n − 1 ) \displaystyle \frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1) S/n Xμt(n1)

X i X_i Xi Y i Y_i Yi 是來自正態總體的相互獨立的樣本。則

  • S 1 2 / S 2 2 σ 1 2 / σ 2 2 ∼ F ( n 1 − 1 , n 2 − 1 ) \displaystyle \frac{S^2_1/S^2_2}{\sigma^2_1/\sigma^2_2}\sim F(n_1-1,n_2-1) σ12/σ22S12/S22F(n11,n21)
  • σ 1 2 = σ 2 2 = σ 2 \sigma^2_1=\sigma^2_2=\sigma^2 σ12=σ22=σ2 時, ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) \displaystyle \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Swn11+n21 (XY)(μ1μ2)t(n1+n22),其中 S w 2 = ( n 1 − 1 ) S 1 2 + ( n 2 − 1 ) S 2 2 n 1 + n 2 − 2 \displaystyle S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2} Sw2=n1+n22(n11)S12+(n21)S22

引數估計

點估計

藉助於總體的一個樣本來估計總體未知引數的值的問題稱為引數的點估計問題。設總體的分佈函式 f ( x ; θ ) f(x;\theta) f(x;θ) 的形式為已知, θ \theta θ 為待估引數。構造一個適當的統計量 θ ^ ( X i ) \hat{\theta}(X_i) θ^(Xi) ,用他的觀察值 θ ^ ( x i ) \hat{\theta}(x_i) θ^(xi),作為未知引數 θ \theta θ 的估計值,稱 θ ^ ( X i ) \hat{\theta}(X_i) θ^(Xi)估計量,稱 θ ^ ( x i ) \hat{\theta}(x_i) θ^(xi)估計值

矩估計法

簡單的講,這個原理認為樣本的n階中心鉅和n階原點矩和總體的n階中心鉅和n階原點矩相同,當然這是一個近似。
設總體的 k k k 階原點矩存在,是基於 θ i \theta_i θi 的函式,基於樣本矩 A t = 1 n ∑ X i l \displaystyle A_t=\frac{1}{n}\sum X_i^l At=n1Xil 依概率收斂於相應的總體矩 μ l \mu_l μl ,樣本矩的連續函式依概率收斂於相應的總體矩的連續函式,於是就用樣本矩作為相應的總體矩的估計量,而以樣本矩的連續函式作為相應的總體矩的連續函式的估計量。稱為 矩估計方法

{ μ 1 = μ 1 ( θ 1 . . . θ k ) , ⋮ μ k = μ k ( θ 1 . . . θ k ) \left\{ \begin{array}{l l} &\mu_1=\mu_1(\theta_1...\theta_k),\\ &\vdots\\ &\mu_k=\mu_k(\theta_1...\theta_k) \end{array} \right. μ1=μ1(θ1...θk),μk=μk(θ1...θk)
可以從中解出 θ k \theta_k θk得到
{ θ 1 = θ 1 ( μ 1 . . . μ k ) , ⋮ θ k = θ k ( μ 1 . . . μ k ) \left\{ \begin{array}{l l} &\theta_1=\theta_1(\mu_1...\mu_k),\\ &\vdots\\ &\theta_k=\theta_k(\mu_1...\mu_k) \end{array} \right. θ1=θ1(μ1...μk),θk=θk(μ1...μk)
A i A_i Ai 分別替代上式 μ \mu μ,就以 θ i ^ = θ i ( A 1 . . . A i ) \hat{\theta_i}=\theta_i(A_1...A_i) θi^=θi(A1...Ai) 分別作 θ i \theta_i θi 的估計量,稱 矩估計量

最大似然估計

最大似然估計可以說是應用非常廣泛的一種引數估計的方法。它的原理也很簡單:利用已知的樣本,找出最有可能生成該樣本的引數。
???

估計量的評選標準

無偏性

若估計量 θ ^ = θ ^ ( X i ) \hat{\theta}=\hat{\theta}(X_i) θ^=θ^(Xi) 的期望 E ( θ ^ ) E(\hat{\theta}) E(θ^) 存在,且對於任意 θ ∈ Θ \theta \in \Theta θΘ E ( θ ^ ) = θ E(\hat{\theta})=\theta E(θ^)=θ ,則稱 Θ ^ \hat{\Theta} Θ^ Θ \Theta Θ無偏估計量

置信區間

區間估計

正態總體均值與方差的區間估計

單個總體

兩個總體

(0-1)分佈引數區間估計

單側置信區間

檢驗假設

正態總體均值檢驗假設

單個總體

兩個總體(t檢驗)

基於成對資料(t檢驗)

正態總體方差檢驗假設

單個總體

兩個總體

分佈擬合檢驗

單個分佈

分佈族的 χ 2 \chi^2 χ2 擬合檢驗

秩和檢驗

p p p 值法