機器學習系列文章:貝葉斯決策理論
引言
訓練計算機使之根據資料進行推斷是統計學和電腦科學的交叉領域,其中統計學家提供有資料做推斷的數學框架,而電腦科學家研究推斷方法如果在計算機上有效地實現。
資料來自於一個不完全清楚的過程,將該過程作為隨機過程建模表明我們缺乏知識。也許該過程實際上是確定性的,但是因為我們沒有獲取關於它的完全知識的途徑,所以我們把它作為一個隨機過程建模,並且用概率理論來分析它。
有時候,我們得不到隨機過程的先驗,所以需要從給定的樣本來估計它,這裡就需要統計學的知識了。簡言之,通過有限樣本估計隨機過程的近似。
1、貝葉斯公式在分類問題中的應用
這裡筆者打算從貝葉斯公式出發,帶大家瞭解貝葉斯在分類問題中的應用。
貝葉斯公式:
這裡筆者直接從公式出發,講解公式中每個量代表的具體含義。假設本統計模型在隨機變數的分佈方式為伯努利分佈。
其中P(C)表示伯努利的先驗概率,如P(C=0)表示統計資料中型別C取0的概率。它是我們看到觀測量x之前就獲得的關於C的知識。滿足
其中,P(x|C)稱為類似然,是屬於C的時間具有相關聯的預測值x的條件概率。例如:P(x1,x2|C=1)是C=1類具有X=x1,X=x2的概率。這就是通過資料我們得到的關於類的資訊。
其中,P(x)稱為證據,是看到觀測x的邊緣概率,無論正例還是負例。由於證據對最終分類結果不會產生影響,所以我們一般省略去。
使用貝葉斯規則,組合先驗知識和資料告訴我們的知識,在看到觀測x之後,計算概念的後驗概率 P(C|x).
上面探討了關於二分類情況下貝葉斯公式,此外,我們可以通過二分類問題推廣到多分類問題。一般情況下,我們有K個互斥的和窮舉的類Ci,當x屬於Ci時,我們可以將後驗概率P(x|Ci)看作x作為輸入的概率。所以多分類一般式如下:
2、分類的另一面:判別式函式
分類也可以看作實現一組判別式函式使得:
根據1中描述,對於公共規範化項證據P(x)我們可以忽略,所以貝葉斯公式就變為:
根據這個公式,我們就把資料的特徵空間分為K個決策區域,這些決策區域通過決策邊界曲線分隔開。如圖:
3、總結
所以,對於一般的分類問題,我們只需要求得,貝葉斯公式中先驗和類似然,其中先驗可以根據統計訓練樣本資料得到,而類似讓可以使用後面講解的最大似然法求得。具體求解過程詳見,筆者系列文章。
引用:機器學習導論
相關文章
- 機器學習Sklearn系列:(四)樸素貝葉斯機器學習
- 【機器學習】--貝葉斯網路機器學習
- 機器學習——貝葉斯演算法機器學習演算法
- 模式識別學習筆記——貝葉斯決策模式筆記
- 模式識別與機器學習筆記專欄之貝葉斯分類決策(一)模式機器學習筆記
- 機器學習|樸素貝葉斯演算法(二)-用sklearn實踐貝葉斯機器學習演算法
- 貝葉斯思想概述:從貝葉斯定理到貝葉斯網路
- 機器學習|樸素貝葉斯演算法(一)-貝葉斯簡介及應用機器學習演算法
- 機器學習之樸素貝葉斯分類機器學習
- 機器學習實戰(三)--樸素貝葉斯機器學習
- 以 Python 為例項,介紹貝葉斯理論Python
- 04貝葉斯演算法-貝葉斯網路演算法
- 從貝葉斯方法談到貝葉斯網路
- 機器學習筆記(七)貝葉斯分類器機器學習筆記
- 機器學習_統計模型之(一)貝葉斯公式機器學習模型公式
- 貝葉斯公式公式
- 機器學習中的MLE、MAP和貝葉斯估計機器學習
- 機器學習讀書筆記:貝葉斯分類器機器學習筆記
- 機器學習之貝葉斯分類(python實現)機器學習Python
- 機器學習_統計模型之(二)貝葉斯網路機器學習模型
- chapter6:概率及樸素貝葉斯--樸素貝葉斯APT
- 機器學習演算法(二): 樸素貝葉斯(Naive Bayes)機器學習演算法AI
- 複習機器學習演算法:貝葉斯分類器機器學習演算法
- [機器學習&資料探勘]樸素貝葉斯數學原理機器學習
- 樸素貝葉斯模型模型
- 貝葉斯分類器與貝葉斯網路之間的關係
- Python機器學習筆記:樸素貝葉斯演算法Python機器學習筆記演算法
- 機器學習之紅樓夢作者判斷(貝葉斯分類)機器學習
- Python機器學習 — 樸素貝葉斯演算法(Naive Bayes)Python機器學習演算法AI
- 全概率公式、貝葉斯公式公式
- 貝葉斯公式及其含義公式
- 樸素貝葉斯法初探
- 貝葉斯迴歸簡介
- 貝葉斯分類器詳解 從零開始 從理論到實踐
- 機器學習演算法筆記之4:貝葉斯分類器機器學習演算法筆記
- 100天搞定機器學習|Day15 樸素貝葉斯機器學習
- 一文讀懂機器學習中的貝葉斯統計學機器學習
- 機器學習經典演算法之樸素貝葉斯分類機器學習演算法