複習機器學習演算法:貝葉斯分類器

bigface1234fdfg發表於2015-03-02

   

    

樸素貝葉斯演算法是尋找一個極大後驗假設(MAP),即候選假設的最大後驗概率。

 

如下:

在樸素貝葉斯分類器中,假設樣本特徵之間是獨立的,則有:


計算每個假設的後驗概率,選出最大的概率,對應的類別就是樣本的分類結果。

 

優缺點:

對小規模的資料表現很好,適合多分類任務,適合增量式訓練。當時,需要樣本的特徵之間獨立性較高,不能有太多的相關性。對輸入資料的表達形式很敏感。

 

還有,當樣本中某個特徵在該類別中出現次數為0,即P(ai |vj)=0, 導致上式的分子全部為0. 這個時候需要使用m-估計和貝葉斯結合,如下:

 

 

相關文章