樸素貝葉斯—印第安人

Syl_Zhu發表於2020-12-01

樸素貝葉斯演算法實現印第安人資料集分類
Step1:導包—pandas/sklearn/numpy
read_csv- 讀取csv檔案
train_test_split 把樣本資料劃分為測試集和訓練集
在這裡插入圖片描述

Cross_val_score 通過交叉驗證評估分數
klearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None, cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’
在這裡插入圖片描述

Step2:資料特徵選擇及劃分
Train_test_split需要資料和標籤,所以在匯入資料的過程中要拿出標籤。

Step3:關於樸素貝葉斯的使用
在這裡插入圖片描述

簡而言之,分析一下資料分佈,離散的話就用二項分佈或者伯努利,連續就用高斯分佈。

Step4:模型配置及訓練……
在這裡插入圖片描述

Step5:模型儲存

在這裡插入圖片描述
在這裡插入圖片描述

下載後方便下次使用

相關文章