AI中有關概率統計的直觀且通俗易懂的圖片介紹

發表於2021-04-01

一幅圖片勝過1000個單詞。有關概率和統計資訊的直觀介紹,請檢視“ Seeing Theory”。這個互動式網站將帶您瞭解機器學習中所需的許多概念。適合菜鳥入門學習,捷徑學習路線,有中文,點選標題。

為幫助無法訪問原網址使用者瞭解,轉載基本概念如下:

 

第一章 基礎概率論

本章將介紹概率論的一些基本概念

  • 概率事件

生活中充滿了隨機性。概率論是一門用數學語言來刻畫這些隨機事件的學科。一個隨機事件的概率是一個介於0與1之間的實數,這個實數的大小反映了這個事件發生的可能性。因此,概率為0意味著這個事件不可能發生(不可能事件),概率為1意味著這個事件必然發生(必然事件)。

以一個投擲一枚公平的硬幣(出現正面和反面的概率相等,均為1/2)的經典的概率實驗為例:。在現實中,如果我們重複拋一枚硬幣,出現正面的頻率可能不會恰好是50%。但是當拋硬幣的次數增加時,出現正面的概率會越來越接近50%。

如果硬幣兩面的重量不一樣, 出現正面的概率就和出現反面的概率不一樣了。

  • 期望

一個隨機變數的期望刻畫的是這個隨機變數的概率分佈的“中心”。簡而言之,當有無窮多來自同一個概率分佈的獨立樣本時,它們的平均值就是期望。數學上對期望的定義是以概率(或密度)為權重的加權平均值。

現在以另一個經典的概率實驗為例:扔一枚公平的骰子,每一面出現的概率相等,均為1/6。當試驗的次數越來越多時,扔出的結果的平均值慢慢趨向於它的期望3.5。

  • 方差

如果說隨機變數的期望刻畫了它的概率分佈的“中心”,那麼方差則刻畫了概率分佈的分散度。方差的定義是一個隨機變數與它的期望之間的差的平方的加權平均值。這裡的權重仍然是概率(或者密度)。

Var(X)=E[(X−E[X])2]

隨機從下面十張牌中抽牌。當抽取的次數越來越多時,可以觀察到樣本平方差的平均值(綠色)逐漸趨向於它的方差(藍色)。

 

第二章 進階概率論

本章將進一步介紹概率論中的一些核心知識。

  • 集合論

廣而言之,一個集合指的是一些物體的總體。在概率論中,我們用一個集合來表示一些事件的組合。比如,我們可以用集合{2,4,6}來表示“投骰子投出偶數”這個事件。因此我們有必要掌握一些基本的集合的運算。

  • 古典概型

古典概型本質上就是數數。但是在概率論中,數數有時候比想象中要困難的多。因為我們有時要數清楚符合一些性質的事件或者軌道個數的,而這些性質往往比較複雜,因此數數的任務也變得困難起來。假設我們有一袋珠子,每個珠子的顏色都不相同。如果我們無放回地從袋子裡抽取珠子,一共有多少種可能出現的顏色序列(排列)呢?有多少種可能出現的沒有順序的序列(組合)呢?

  • 條件概率

條件概率讓我們可以利用已有的資訊。舉個例子,在今天多雲 的情況下,我們會估計“明天下雨”的概率小於“今天下雨”。這種基於已有的相關資訊得出的概率稱為條件概率。

數學上,條件概率的計算一般會把的樣本空間縮小到一個我們已知資訊的事件。再以之前舉的下雨為例,我們現在只考慮所有前一天多雲的日子,而不是考慮所有的日子。然後我們確定在這些天中有多少天下雨,這些下雨天數在所有我們考慮的天數中的比例即為條件概率。

 

第三章 概率分佈

概率分佈描述了隨機變數取值的規律。

  • 隨機變數

隨機變數是一個函式,它用數字來表示一個可能出現的事件。你可以定義你自己的隨機變數,然後生成一些樣本來觀察它的經驗分佈。

  • 離散型和連續型隨機變數

常見的隨機變數兩種型別。一個離散型隨機變數可能的取值範圍只有有限個或可列個值。離散型隨機變數的定義是:如果XX是一個隨機變數,存在非負函式f(x)f(x)和F(X)F(X),使得

P(X=x)=f(x)
P(X<x)=F(x)

則稱XX是一個離散型隨機變數。

  • 中心極限定理

中心極限定理告訴我們,對於一個(性質比較好的)分佈,如果我們有足夠大的獨立同分布的樣本,其樣本均值會(近似地)呈正態分佈。樣本數量越大,其分佈與正態越接近。

 

第四章 統計推斷:頻率學派

頻率學派通過觀察資料來確定背後的概率分佈。

  • 點估計

統計學中一個主要的問題是估計引數。我們用一個取值為樣本的函式來估計我們感興趣的引數,並稱這個函式為估計量。這裡我們用一個估計圓周率ππ的例子來具體說明這個想法。

  • 置信區間

與點估計不同,置信區間用估計的是一個引數的範圍。一個置信區間對應著一個置信水平:一個置信水平為95%95%的置信區間表示這個置信區間包含了真實引數的概率為95%95%。

  • Bootstrap方法

許多頻率學派的統計推斷側重於使用一些“性質比較良好”的估計量。但是我們知道這些統計量本身是樣本的函式,因此往往比較難分析它們自己的概率分佈。而Bootstrap方法則給我們提供了一種方便的近似確定估計量性質的方法。

 

第五章 統計推斷:貝葉斯學派

貝葉斯學派的思想是用資料來更新特定假設的概率。

  • 貝葉斯公式

假設你最近去看了醫生,並決定檢查一下自己有沒有得一種罕見的疾病。如果你很不幸地收到了陽性的結果,你可能最想知道的是“已知這個檢查結果,我真的得了這種病的概率是多少?”(畢竟醫療檢查並不是100%準確的。)有了貝葉斯公式,我們就可以準確地計算出上述事件的概率:

P(患病|陽性)=P(陽性|患病)P(患病)/P(陽性)

從上述公式我們可以看出,已知檢查結果陽性患病的後驗還依賴於概率患病的先驗概率P(患病)。我們可以把這個患病的先驗概率理解為人群中患有這個疾病的概率。

另一方面,後驗概率還依賴於檢查的準確程度:一個健康的人收到陰性結果的概率是多少?一個患者收到陽性結果的概率是多少?

最後,我們還需要知道這個檢查給出陽性結果的總概率。

  • 似然函式

在統計學中, 似然函式 的定義是:

L(θ|x)=P(x|θ)

似然函式的概念在頻率學派和貝葉斯學派中都有重要的作用。

  • 從先驗概率到後驗概率

貝葉斯統計的核心思想是利用觀察到的資料來更新先驗資訊。

 

第六章 迴歸分析

迴歸分析是一種建立兩個變數之間線性模型的方法

  • 最小二乘法

最小二乘法是一個估計線性模型引數的方法。這個方法的目標是找到一組線性模型引數,使得這個模型預測的資料和實際資料間的平方誤差達到最小。這是四個讓讓統計學家一度十分頭疼的資料集:安斯庫姆四重奏,你可以通過這四個資料集進一步探索最小二乘法。

  • 相關性

相關性是一種刻畫兩個變數之間線性關係的度量。

  • 方差分析

方差分析(ANONA,Analysis of Variace)是一種檢驗各組資料是否有相同均值的統計學方法。方差分析將t檢驗從檢驗兩組資料均值推廣到檢驗多組資料均值,其主要方法是比較組內和組間平方誤差。

 

相關文章