使用XGboost模組XGBClassifier、plot_importance來做特徵重要性排序

小白tree發表於2019-09-01

'''
參考：http://www.shujuren.org/article/625.html
'''
from numpy import loadtxt
from xgboost import XGBClassifier
from xgboost import plot_importance
from matplotlib import  pyplot
import warnings
warnings.filterwarnings("ignore")

# np.load_txt使用方法：www.manongjc.com/article/4883.html
# 以','為分割符，跳過1行（標features那一行）
dataset = loadtxt(r"H:\randomForest_file\feat_sort\XGboot\label_csv.csv", skiprows=1, delimiter=",") 
print(dataset)

# 資料集劃分特徵矩陣X和目標變數y
X = dataset[:,1:-1] # 每一行都要（之前已經把第一行跳過了，所以這裡全都是純資料）
y = dataset[:,-1]   # 這個是分類結果label
print('*****************')
# print(X)

print(y.shape)
# 全量資料集訓練模型
model = XGBClassifier()
model.fit(X, y)

# 變數重要性列表
print(model.feature_importances_)

# 變數重要性視覺化
pyplot.bar(range(len(model.feature_importances_)), model.feature_importances_)
pyplot.show()

# 變數重要性排序視覺化
plot_importance(model)
pyplot.show()

因為原資料保密，你們用下面的資料集data.csv也可以（看下格式就好啦~）
在這裡插入圖片描述

1.特徵值重要性圖：
在這裡插入圖片描述
2.特徵重要性排序圖：

（這裡有個不完美的地方，xgboost模組竟然沒有提供改feature name的方法！所以全是f0,f1,f2,…，你只能對照資料檔案看誰是第0個feature誰是第1個了）

想要修改f1,f2等欄位請戳這裡

xgboost特徵重要性
2019-02-16
特徵
用xgboost模型對特徵重要性進行排序
2018-08-12
模型特徵排序
【特徵工程】（資料）使用Xgboost篩選特徵重要性
2019-12-14
特徵工程
xgboost 特徵重要性計算
2018-11-13
特徵
XGBoost 輸出特徵重要性以及篩選特徵
2018-08-26
特徵
xgboost 特徵重要性選擇 / 看所有特徵哪個重要
2018-06-06
特徵
XGBoost學習（六）：輸出特徵重要性以及篩選特徵
2020-09-03
特徵
xgboost模型特徵重要性的不同計算方式
2019-09-17
模型特徵
用xgboost獲取特徵重要性及應用
2019-11-20
特徵
用xgboost獲取特徵重要性原理及實踐
2019-04-13
特徵
xgboost輸出特徵重要性排名和權重值
2018-07-29
特徵
分別利用xgbboost和catboost演算法做特徵重要性排序
2020-11-13
演算法特徵排序
【演算法】關於xgboost特徵重要性的評估
2019-05-29
演算法特徵
xgboost 特徵選擇，篩選特徵的正要性
2018-04-17
特徵
RF、GBDT、XGboost特徵選擇方法
2018-04-19
特徵
xgboost 設定每條資料的重要性
2018-07-25
Python中XGBoost的特性重要性和特性選擇
2019-03-27
Python
python之排序操作及heapq模組
2019-02-16
Python排序
機器學習之基於xgboost的特徵篩選
2020-03-19
機器學習特徵
使用Vue+Django+Ant Design做一個留言評論模組
2020-05-31
VueDjango
如何用XGBoost做時間序列預測？
2020-09-02
xgboost get_fscore 判斷特徵重要程度的三種指標
2018-06-06
特徵指標
使用typescript開發angular模組(編寫模組)
2018-04-23
TypeScriptAngular
pymysql模組的使用
2018-10-18
MySql
wtforms模組的使用
2024-03-06
ORM
FPGA排序模組與verilog實現【含原始碼!!!】
2020-08-11
FPGA排序原始碼
XGBoost類庫使用小結
2019-07-01
我是如何做評論模組的？
2021-09-09
[譯] 為什麼我不再使用 export default 來匯出模組
2019-01-25
Export
glom模組的使用(一)
2018-10-25
glom模組的使用(二)
2018-10-25
Paramiko模組簡單使用
2018-08-22
Python中模組的使用
2018-05-31
Python
openpyxl模組的日常使用
2024-11-22
Flask：sqlalchemy模組的使用
2021-09-11
FlaskSQL
Python logging模組的使用
2020-12-06
Python
用 shelve 模組來存資料
2019-08-31
反射,hashlib模組,正則匹配,冒泡，選擇，插入排序
2020-04-04
反射排序

使用XGboost模組XGBClassifier、plot_importance來做特徵重要性排序

相關文章