Machine Learning-樸素貝葉斯演算法

redis_v發表於2016-01-11

原文網址 : https://blog.csdn.net/leonis_v/article/details/50499847

Mac演算法

貝葉斯定理

如何得到兩個事件交換後的概率，也就是在已知P(A|B)的情況下如何求得P(B|A)。這裡先解釋什麼是條件概率：

表示事件B已經發生的前提下，事件A發生的概率，叫做事件B發生下事件A的條件概率。其基本求解公式為：

$P(A|B)=\frac{P(AB)}{P(B)}$

下面不加證明地直接給出貝葉斯定理：

$P(B|A)=\frac{P(A|B)P(B)}{P(A)}$

樸素貝葉斯分類的原理與流程

樸素貝葉斯分類是一種十分簡單的分類演算法，叫它樸素貝葉斯分類是因為這種方法的思想真的很樸素，樸素貝葉斯的思想基礎是這樣的：對於給出的待分類項，求解在此項出現的條件下各個類別出現的概率，哪個最大，就認為此待分類項屬於哪個類別。通俗來說，就好比這麼個道理，你在街上看到一個黑人，我問你你猜這哥們哪裡來的，你十有八九猜非洲。為什麼呢？因為黑人中非洲人的比率最高，當然人家也可能是美洲人或亞洲人，但在沒有其它可用資訊下，我們會選擇條件概率最大的類別，這就是樸素貝葉斯的思想基礎。

樸素貝葉斯分類的正式定義如下：

1、設 $x=\{a_1,a_2,...,a_m\}$ 為一個待分類項，而每個a為x的一個特徵屬性。

2、有類別集合 $C=\{y_1,y_2,...,y_n\}$ 。

3、計算。

4、如果 $P(y_k|x)=max\{P(y_1|x),P(y_2|x),...,P(y_n|x)\}$ ，則 $x \in y_k$ 。

那麼現在的關鍵就是如何計算第3步中的各個條件概率。我們可以這麼做：

1、找到一個已知分類的待分類項集合，這個集合叫做訓練樣本集。

2、統計得到在各類別下各個特徵屬性的條件概率估計。即。

3、如果各個特徵屬性是條件獨立的，則根據貝葉斯定理有如下推導：

$P(y_i|x)=\frac{P(x|y_i)P(y_i)}{P(x)}$

因為分母對於所有類別為常數，因為我們只要將分子最大化皆可。又因為各特徵屬性是條件獨立的，所以有：

$P(x|y_i)P(y_i)=P(a_1|y_i)P(a_2|y_i)...P(a_m|y_i)P(y_i)=P(y_i)\prod^m_{j=1}P(a_j|y_i)$

根據上述分析，樸素貝葉斯分類的流程可以由下圖表示（暫時不考慮驗證）：

可以看到，整個樸素貝葉斯分類分為三個階段：

第一階段——準備工作階段，這個階段的任務是為樸素貝葉斯分類做必要的準備，主要工作是根據具體情況確定特徵屬性，並對每個特徵屬性進行適當劃分，然後由人工對一部分待分類項進行分類，形成訓練樣本集合。這一階段的輸入是所有待分類資料，輸出是特徵屬性和訓練樣本。這一階段是整個樸素貝葉斯分類中唯一需要人工完成的階段，其質量對整個過程將有重要影響，分類器的質量很大程度上由特徵屬性、特徵屬性劃分及訓練樣本質量決定。

第二階段——分類器訓練階段，這個階段的任務就是生成分類器，主要工作是計算每個類別在訓練樣本中的出現頻率及每個特徵屬性劃分對每個類別的條件概率估計，並將結果記錄。其輸入是特徵屬性和訓練樣本，輸出是分類器。這一階段是機械性階段，根據前面討論的公式可以由程式自動計算完成。

第三階段——應用階段。這個階段的任務是使用分類器對待分類項進行分類，其輸入是分類器和待分類項，輸出是待分類項與類別的對映關係。這一階段也是機械性階段，由程式完成。

樸素貝葉斯演算法
2022-04-12
演算法
樸素貝葉斯模型
2024-03-13
模型
分類演算法-樸素貝葉斯
2020-01-17
演算法
04_樸素貝葉斯演算法
2020-05-30
演算法
ML-樸素貝葉斯
2019-03-20
樸素貝葉斯分類
2023-01-27
樸素貝葉斯和半樸素貝葉斯（AODE）分類器Python實現
2019-12-30
Python
樸素貝葉斯與Laplace平滑
2023-03-07
樸素貝葉斯—印第安人
2020-12-01
樸素貝葉斯/SVM文字分類
2018-10-25
文字分類
樸素貝葉斯演算法的實現與推理
2022-05-06
演算法
監督學習之樸素貝葉斯
2020-02-14
樸素貝葉斯實現文件分類
2019-10-07
簡單易懂的樸素貝葉斯分類演算法
2018-09-21
演算法
Python機器學習 — 樸素貝葉斯演算法（Naive Bayes）
2018-07-10
Python機器學習演算法AI
Python機器學習筆記：樸素貝葉斯演算法
2019-05-18
Python機器學習筆記演算法
機器學習演算法（二）: 樸素貝葉斯(Naive Bayes)
2020-12-23
機器學習演算法AI
樸素貝葉斯分類流程圖介紹
2018-05-09
流程圖
使用樸素貝葉斯過濾垃圾郵件
2020-02-03
Sklearn中的樸素貝葉斯分類器`
2020-10-20
樸素貝葉斯--新浪新聞分類例項
2019-03-02
機器學習之樸素貝葉斯分類
2019-02-28
機器學習
[譯] Sklearn 中的樸素貝葉斯分類器
2018-08-28
HanLP-樸素貝葉斯分類預測缺陷
2019-07-22
HanLP
機器學習Sklearn系列：（四）樸素貝葉斯
2021-07-18
機器學習
演算法金 | AI 基石，無處不在的樸素貝葉斯演算法
2024-06-10
演算法AI
機器學習經典演算法之樸素貝葉斯分類
2019-06-22
機器學習演算法
（實戰）樸素貝葉斯實現垃圾分類_201121
2020-11-21
樸素貝葉斯分類和預測演算法的原理及實現
2018-03-28
演算法
《統計學習方法》——樸素貝葉斯程式碼實現
2021-02-28
樸素貝葉斯入門例項之就是這麼簡單
2019-02-21
100天搞定機器學習|Day15 樸素貝葉斯
2019-08-05
機器學習
資料探勘從入門到放棄（三）：樸素貝葉斯
2020-09-25
詳解樸素貝葉斯的來源，原理以及例項解析
2020-11-01
有監督學習——支援向量機、樸素貝葉斯分類
2023-03-15
第7章基於樸素貝葉斯的垃圾郵件分類
2018-09-22
樸素貝葉斯深度解碼：從原理到深度學習應用
2023-11-17
深度學習
樸素貝葉斯：幫助AI產品經理“小步快跑，快速迭代”
2019-09-15
AI
樸素貝葉斯分類-實戰篇-如何進行文字分類
2020-11-25
文字分類

Machine Learning-樸素貝葉斯演算法

樸素貝葉斯分類的原理與流程

相關文章