【數學基礎篇】--詳解人工智慧之數學 積分學,概率空間,大數定律和中心極限定理

LHBlog發表於2018-09-09

一、前述

上一篇我們講到了微分學,本文我們接著講解積分學,以及概率的相關知識。

二、常用符號

三、積分

1、積分定義

將一個函式對應的區間n等分,然後加和求極限。

2、積分理解

代數意義: 無窮求和

幾何意義: 函式與 X 軸之間的有向面積。

3、(牛頓-萊布尼茨公式)

如果 f(x) 是定義在閉區間 [a, b] 上的可微函式, 那麼就有

不定積分表示為

牛頓-萊布尼茨公式展示了微分與積分的基本關係: 在一定程度上微分與積分互 為逆運算.

 4、案例

求函式 ln(x) 的不定積分。

5、多變數函式的積分

如果積分割槽域形狀不規則,可以用一個矩形把積分割槽域包起 來,並令函式在積分割槽域外邊等於 0.

二重積分的幾何意義是積分函式與 X − Y 座標平面之間部 分的有向體積.

 6、積分學總結

積分的代數意義是無窮求和,幾何意義是帶符號的體積

微分和積分在一定程度上互為逆運算

熟悉微分公式有助於計算積分

多重積分可以理解成是依次進行的單重積分

四、隨機變數與概率

1、離散隨機變數(發生事件的幾種情況,比如扔塞子。1-6為隨機變數)

比如上述事件<=3就是1.2.3事件概率取值。

2、連續隨機變數

對於每一個具體的取值的概率為0.

對於連續型隨機變數,概率為概率密度函式的積分.

不論是離散還是連續型隨機變數, 概率函式和概率密度函式 的定義域即為這個隨機變數的值域.

作為一個特殊的概率函式,分佈函式定義為 Φ(x) = P(X < x).

我們在此只考慮幾乎處處連續的概率密度函式,我們不考慮離散,連續混 合型的隨機變數

 3、概率

事件的概率(事件是一個集合)

整個概率空間是一個事件,這個事件一定發生所以全空間的 概率為 1

事件是隨機變數值域的子集 S

事件的概率則表示 S 裡面概率之和或概率密度之積分.

事件的條件概率

條件本身也是事件,也可表示為隨機變數值域的子集:A

條件概率裡面的事件,又是這個條件的子集:S ∩ A ⊂ A

概率其實就是集合的大小比例,而概率函式或者概率密度函式可以理解為比較 大小時候的權重

 4、貝葉斯公式

利用前面的定義我們知道,事件 A, B 同時發生的概率為 P(A ∩ B),

一方面 P(A ∩ B) = P(B|A)P(A)

另一方面對稱的有 P(A ∩ B) = P(A|B)P(B)

所以 P(B|A)P(A) = P(A|B)P(B),

兩邊同時除以 P(B) 就得到 了貝葉斯公式.

五、隨機變數與概率:共軛分佈

 1、概述

常見的概率分佈基本上都有引數,比如正態分佈有 (µ, σ) 兩個參 數,泊松分佈有一個引數 λ. 對於一個具體的問題而言,關於這 些引數有兩種不同的看法

利用經驗得到一個關於引數的先驗分佈.(Bayesian)

不對引數先驗分佈做任何假設,只利用當前觀測的資料來對 引數進行估計.(Frequentist)。

2、先驗分佈,似然函式,後驗分佈

引數先驗分佈為 p(θ) 似然函式為 p(x|θ) 觀測值為 X,貝葉斯的思想是根據觀測值來調整引數的先驗分佈從而得到引數 的後驗分佈. 引數後驗分佈為

3、共軛分佈

如果引數的後驗分佈與先驗分佈屬於同一類分佈,那麼我們說這 種先驗分佈為共軛分佈 (Conjugate prior). 比如

似然函式為正態分佈時, 如果 σ 已知,關於 µ 的正太分佈是 共軛分佈 似然函式為正態分佈時, 如果 µ 已知,關於 σ 的反 Gamma 分佈是共軛分佈

共軛分佈的好處在於,先驗與後驗分佈屬於一個大類,這樣計算 和理解上都比較方便.

4、小結 (隨機變數與概率)

概率可以理解為事件所代表的集合在全概率空間中的比例

對於概率分佈引數的先驗分佈有不同的觀點

如果引數先驗分佈與後驗分佈屬於同一類,則叫做共軛分佈.

六、大數定律和中心極限定理

1、隨機變數的矩

X 是一個隨機變數對於任何正整數 n,定義

矩可以描述隨機變數的一些特徵,

期望是 X“中心”位置的一種 描述,

方差可以描述 X 的分散程度,

特徵函式可以全面描述概率 分佈.

2、切比雪夫不等式

設 X 為隨機變數,期望值為 µ, 標準差為 σ, 對於任何實數 k > 0

切比雪夫不等式給出方差對 X 分散程度的描述提供了一個定量 的估計.

如何證明切比雪夫不等式:

 

3、隨機變數的相關係數

X,Y 是兩個隨機變數。

X, Y 的協方差:cov(X, Y ) = E(XY ) − E(X)E(Y )

X, Y 的相關係數

4、獨立隨機變數

X,Y 是兩個隨機變數如果聯合分佈 p(x, y) = p(x)p(y),

則 X, Y 為獨立隨機變數. 獨立隨機變數相關係數為 0

相關係數為零,兩個隨機變數不見得獨立

5、特殊分佈的特徵函式

6、大數定律

自然對數底數 e 的定義。

定義:

 

 7、中心極限定理

 8、總結

隨機變數的矩可以描述隨機變數所服從分佈的性質

隨機變數的特徵函式可以全面描述隨機變數的分佈

切比雪夫不等式指出方差可以描述隨機變數取值的分散程度

大數定律指出獨立重複實驗的平均值的收斂規律

中心極限定理給出獨立重複實驗平均值更細緻的描述

 

 

相關文章