一、前述
上一篇我們講到了微分學,本文我們接著講解積分學,以及概率的相關知識。
二、常用符號
三、積分
1、積分定義
將一個函式對應的區間n等分,然後加和求極限。
2、積分理解
代數意義: 無窮求和
幾何意義: 函式與 X 軸之間的有向面積。
3、(牛頓-萊布尼茨公式)
如果 f(x) 是定義在閉區間 [a, b] 上的可微函式, 那麼就有
不定積分表示為
牛頓-萊布尼茨公式展示了微分與積分的基本關係: 在一定程度上微分與積分互 為逆運算.
4、案例
求函式 ln(x) 的不定積分。
5、多變數函式的積分
如果積分割槽域形狀不規則,可以用一個矩形把積分割槽域包起 來,並令函式在積分割槽域外邊等於 0.
二重積分的幾何意義是積分函式與 X − Y 座標平面之間部 分的有向體積.
6、積分學總結
積分的代數意義是無窮求和,幾何意義是帶符號的體積
微分和積分在一定程度上互為逆運算
熟悉微分公式有助於計算積分
多重積分可以理解成是依次進行的單重積分
四、隨機變數與概率
1、離散隨機變數(發生事件的幾種情況,比如扔塞子。1-6為隨機變數)
比如上述事件<=3就是1.2.3事件概率取值。
2、連續隨機變數
對於每一個具體的取值的概率為0.
對於連續型隨機變數,概率為概率密度函式的積分.
不論是離散還是連續型隨機變數, 概率函式和概率密度函式 的定義域即為這個隨機變數的值域.
作為一個特殊的概率函式,分佈函式定義為 Φ(x) = P(X < x).
我們在此只考慮幾乎處處連續的概率密度函式,我們不考慮離散,連續混 合型的隨機變數
3、概率
事件的概率(事件是一個集合)
整個概率空間是一個事件,這個事件一定發生所以全空間的 概率為 1
事件是隨機變數值域的子集 S
事件的概率則表示 S 裡面概率之和或概率密度之積分.
事件的條件概率
條件本身也是事件,也可表示為隨機變數值域的子集:A
條件概率裡面的事件,又是這個條件的子集:S ∩ A ⊂ A
概率其實就是集合的大小比例,而概率函式或者概率密度函式可以理解為比較 大小時候的權重
4、貝葉斯公式
利用前面的定義我們知道,事件 A, B 同時發生的概率為 P(A ∩ B),
一方面 P(A ∩ B) = P(B|A)P(A)
另一方面對稱的有 P(A ∩ B) = P(A|B)P(B)
所以 P(B|A)P(A) = P(A|B)P(B),
兩邊同時除以 P(B) 就得到 了貝葉斯公式.
五、隨機變數與概率:共軛分佈
1、概述
常見的概率分佈基本上都有引數,比如正態分佈有 (µ, σ) 兩個參 數,泊松分佈有一個引數 λ. 對於一個具體的問題而言,關於這 些引數有兩種不同的看法
利用經驗得到一個關於引數的先驗分佈.(Bayesian)
不對引數先驗分佈做任何假設,只利用當前觀測的資料來對 引數進行估計.(Frequentist)。
2、先驗分佈,似然函式,後驗分佈
引數先驗分佈為 p(θ) 似然函式為 p(x|θ) 觀測值為 X,貝葉斯的思想是根據觀測值來調整引數的先驗分佈從而得到引數 的後驗分佈. 引數後驗分佈為
3、共軛分佈
如果引數的後驗分佈與先驗分佈屬於同一類分佈,那麼我們說這 種先驗分佈為共軛分佈 (Conjugate prior). 比如
似然函式為正態分佈時, 如果 σ 已知,關於 µ 的正太分佈是 共軛分佈 似然函式為正態分佈時, 如果 µ 已知,關於 σ 的反 Gamma 分佈是共軛分佈
共軛分佈的好處在於,先驗與後驗分佈屬於一個大類,這樣計算 和理解上都比較方便.
4、小結 (隨機變數與概率)
概率可以理解為事件所代表的集合在全概率空間中的比例
對於概率分佈引數的先驗分佈有不同的觀點
如果引數先驗分佈與後驗分佈屬於同一類,則叫做共軛分佈.
六、大數定律和中心極限定理
1、隨機變數的矩
X 是一個隨機變數對於任何正整數 n,定義
矩可以描述隨機變數的一些特徵,
期望是 X“中心”位置的一種 描述,
方差可以描述 X 的分散程度,
特徵函式可以全面描述概率 分佈.
2、切比雪夫不等式
設 X 為隨機變數,期望值為 µ, 標準差為 σ, 對於任何實數 k > 0
切比雪夫不等式給出方差對 X 分散程度的描述提供了一個定量 的估計.
如何證明切比雪夫不等式:
3、隨機變數的相關係數
X,Y 是兩個隨機變數。
X, Y 的協方差:cov(X, Y ) = E(XY ) − E(X)E(Y )
X, Y 的相關係數
4、獨立隨機變數
X,Y 是兩個隨機變數如果聯合分佈 p(x, y) = p(x)p(y),
則 X, Y 為獨立隨機變數. 獨立隨機變數相關係數為 0
相關係數為零,兩個隨機變數不見得獨立
5、特殊分佈的特徵函式
6、大數定律
自然對數底數 e 的定義。
定義:
7、中心極限定理
8、總結
隨機變數的矩可以描述隨機變數所服從分佈的性質
隨機變數的特徵函式可以全面描述隨機變數的分佈
切比雪夫不等式指出方差可以描述隨機變數取值的分散程度
大數定律指出獨立重複實驗的平均值的收斂規律
中心極限定理給出獨立重複實驗平均值更細緻的描述