機器學習實戰-邊學邊讀python程式碼(5)
def classifyNB(vec2Classify, p0Vec, p1Vec, pClass1):
p1 = sum(vec2Classify * p1Vec) + log(pClass1)
p0 = sum(vec2Classify * p0Vec) + log(1.0 – pClass1)
if p1 > p0:
return 1
else:
return 0
注意:
p1Vect = log(p1Num/p1Denom)
p0Vect = log(p0Num/p0Denom)
>>> p0V
array([ 0.04166667, 0.04166667, 0.04166667, 0. , 0. ,
.
.
0.04166667, 0. , 0.04166667, 0. , 0.04166667,
0.04166667, 0.125 ])
>>> p1V
array([ 0. , 0. , 0. , 0.05263158, 0.05263158,
.
.
0. , 0.15789474, 0. , 0.05263158, 0. ,
0. , 0. ])
p(w0,w1,w2..wN|ci) = p(w0|ci)p(w1|ci)p(w2|ci)…p(wN|ci),
在本例中,ci分為侮辱性和非侮辱性兩個類別,而w0,w1,w2..wN為單詞向量(文件中所有單詞的彙總),p0V和p1V是由訓練文件計算出來的,如果文件為侮辱性文件,統計文件中各個詞語在單詞向量中出現情況,計算出概率向量p0V,同樣計算出p1V.
貝葉斯定理如下:
p(ci|w)
= p(w|ci)p(ci)/p(w)
=p(w0,w1,w2..wN|ci)p(ci)/p(w)
=p(w0|ci)p(w1|ci)p(w2|ci)..p(wN|ci)p(ci)/p(w)
計算一個特定的文件w屬於c0(侮辱性文件)或者c1(非侮辱性文件),統計這篇文件中各個單詞在兩個不同類別中的出現概率,由貝葉斯公式進行量化,也就是把特定文件中的每個單詞在p0V或者p1V中找到對應的單詞概率,把這些概率相乘,即p(w0|ci)p(w1|ci)p(w2|ci)..p(wN|ci),再乘以p(ci),最後的結果得出兩個概率值,概率大的即為特定文件最後的類別。
作者:
HarlanC
部落格地址:
http://www.cnblogs.com/harlanc/
個人部落格:
http://www.harlancn.me/
本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出,
原文連結
如果覺的博主寫的可以,收到您的贊會是很大的動力,如果您覺的不好,您可以投反對票,但麻煩您留言寫下問題在哪裡,這樣才能共同進步。謝謝!
相關文章
- 機器學習實戰-邊學邊讀python程式碼(4)機器學習Python
- Elasticsearch 邊讀邊譯Elasticsearch
- 機器學習——邊角料機器學習
- 聽技術播客:一邊學Python程式設計一邊學英語Python程式設計
- iOS 邊學邊記iOS
- 邊寫 Javascript 程式碼邊玩遊戲 – WarriorJSJavaScript遊戲JS
- Flutter實現一個邊讀邊處理邊傳送檔案的功能Flutter
- 在風變程式設計學習Python,找到了邊玩邊學的樂趣程式設計Python
- 【Python | 邊敲邊學邊記】第一次:正規表示式Python
- 【Python | 邊學邊敲邊記】第三次:URL去重策略Python
- 風變程式設計邊學習邊實操,讓過程更快樂!程式設計
- 【Python | 邊學邊敲邊記】第四次:初識爬蟲框架ScrapyPython爬蟲框架
- 邊學邊玩CSS GridCSS
- python去除圖片白邊黑邊Python
- Akka邊學邊寫(2)-- Echo ServerServer
- 【Python | 邊學邊敲邊記】第二次:深度&&廣度優先演算法Python演算法
- 機器學習程式碼實現 SVM (5)機器學習
- 邊做邊學入門微信小程式之仿豆瓣評分微信小程式
- css實現半透明邊框程式碼例項CSS
- canvas實現的多邊形程式碼例項Canvas
- 基於Sklearn機器學習程式碼實戰機器學習
- 四大遊戲程式設計網站,邊玩遊戲,邊學Python,拒絕枯燥快樂程式設計遊戲程式設計網站Python
- Minecraft 從入門到入坑(邊玩遊戲邊學程式設計)Raft遊戲程式設計
- to banq : 請教如何邊學習邊實踐的方法論問題
- [邊學邊練]用簡單例項學習React單例React
- Unity 利用Cache實現邊下邊玩Unity
- CSS虛線邊框效果程式碼CSS
- 文字嵌入邊框程式碼例項
- css多重邊框程式碼例項CSS
- 程式碼安全邊緣性問題
- 正兒八經學iOS系列 - AVPlayer實現流音訊邊播邊存iOS音訊
- 邊玩邊學!互動式視覺化圖解!快收藏這18個機器學習和資料科學網站!⛵視覺化圖解機器學習資料科學網站
- 邊緣計算場景下雲邊端一體化的挑戰與實踐
- 邊學邊做的第一個Unity小遊戲Unity遊戲
- Go 邊看邊練 - 《Go 學習筆記》系列Go筆記
- Innov8-邊玩遊戲,邊學業務流程管理遊戲
- python機器學習實戰(二)Python機器學習
- css3實現的多重邊框程式碼例項CSSS3