使用XGboost模組XGBClassifier、plot_importance來做特徵重要性排序
'''
參考:http://www.shujuren.org/article/625.html
'''
from numpy import loadtxt
from xgboost import XGBClassifier
from xgboost import plot_importance
from matplotlib import pyplot
import warnings
warnings.filterwarnings("ignore")
# np.load_txt使用方法:www.manongjc.com/article/4883.html
# 以','為分割符,跳過1行(標features那一行)
dataset = loadtxt(r"H:\randomForest_file\feat_sort\XGboot\label_csv.csv", skiprows=1, delimiter=",")
print(dataset)
# 資料集劃分特徵矩陣X和目標變數y
X = dataset[:,1:-1] # 每一行都要(之前已經把第一行跳過了,所以這裡全都是純資料)
y = dataset[:,-1] # 這個是分類結果label
print('*****************')
# print(X)
print(y.shape)
# 全量資料集訓練模型
model = XGBClassifier()
model.fit(X, y)
# 變數重要性列表
print(model.feature_importances_)
# 變數重要性視覺化
pyplot.bar(range(len(model.feature_importances_)), model.feature_importances_)
pyplot.show()
# 變數重要性排序視覺化
plot_importance(model)
pyplot.show()
因為原資料保密,你們用下面的資料集data.csv也可以(看下格式就好啦~)
1.特徵值重要性圖:
2.特徵重要性排序圖:
(這裡有個不完美的地方,xgboost模組竟然沒有提供改feature name的方法!所以全是f0,f1,f2,…,你只能對照資料檔案看誰是第0個feature誰是第1個了)
相關文章
- xgboost特徵重要性特徵
- 用xgboost模型對特徵重要性進行排序模型特徵排序
- 【特徵工程】(資料)使用Xgboost篩選特徵重要性特徵工程
- xgboost 特徵重要性計算特徵
- XGBoost 輸出特徵重要性以及篩選特徵特徵
- xgboost 特徵重要性選擇 / 看所有特徵哪個重要特徵
- XGBoost學習(六):輸出特徵重要性以及篩選特徵特徵
- xgboost模型特徵重要性的不同計算方式模型特徵
- 用xgboost獲取特徵重要性及應用特徵
- 用xgboost獲取特徵重要性原理及實踐特徵
- xgboost輸出特徵重要性排名和權重值特徵
- 分別利用xgbboost和catboost演算法做特徵重要性排序演算法特徵排序
- 【演算法】關於xgboost特徵重要性的評估演算法特徵
- xgboost 特徵選擇,篩選特徵的正要性特徵
- RF、GBDT、XGboost特徵選擇方法特徵
- xgboost 設定每條資料的重要性
- Python中XGBoost的特性重要性和特性選擇Python
- python之排序操作及heapq模組Python排序
- 機器學習之 基於xgboost的特徵篩選機器學習特徵
- 使用Vue+Django+Ant Design做一個留言評論模組VueDjango
- 如何用XGBoost做時間序列預測?
- xgboost get_fscore 判斷特徵重要程度的三種指標特徵指標
- 使用typescript開發angular模組(編寫模組)TypeScriptAngular
- pymysql模組的使用MySql
- wtforms模組的使用ORM
- FPGA排序模組與verilog實現【含原始碼!!!】FPGA排序原始碼
- XGBoost類庫使用小結
- 我是如何做評論模組的?
- [譯] 為什麼我不再使用 export default 來匯出模組Export
- glom模組的使用(一)
- glom模組的使用(二)
- Paramiko模組簡單使用
- Python中模組的使用Python
- openpyxl模組的日常使用
- Flask:sqlalchemy模組的使用FlaskSQL
- Python logging模組的使用Python
- 用 shelve 模組來存資料
- 反射,hashlib模組,正則匹配,冒泡,選擇,插入排序反射排序