使用XGboost模組XGBClassifier、plot_importance來做特徵重要性排序
'''
參考:http://www.shujuren.org/article/625.html
'''
from numpy import loadtxt
from xgboost import XGBClassifier
from xgboost import plot_importance
from matplotlib import pyplot
import warnings
warnings.filterwarnings("ignore")
# np.load_txt使用方法:www.manongjc.com/article/4883.html
# 以','為分割符,跳過1行(標features那一行)
dataset = loadtxt(r"H:\randomForest_file\feat_sort\XGboot\label_csv.csv", skiprows=1, delimiter=",")
print(dataset)
# 資料集劃分特徵矩陣X和目標變數y
X = dataset[:,1:-1] # 每一行都要(之前已經把第一行跳過了,所以這裡全都是純資料)
y = dataset[:,-1] # 這個是分類結果label
print('*****************')
# print(X)
print(y.shape)
# 全量資料集訓練模型
model = XGBClassifier()
model.fit(X, y)
# 變數重要性列表
print(model.feature_importances_)
# 變數重要性視覺化
pyplot.bar(range(len(model.feature_importances_)), model.feature_importances_)
pyplot.show()
# 變數重要性排序視覺化
plot_importance(model)
pyplot.show()
因為原資料保密,你們用下面的資料集data.csv也可以(看下格式就好啦~)
1.特徵值重要性圖:
2.特徵重要性排序圖:
(這裡有個不完美的地方,xgboost模組竟然沒有提供改feature name的方法!所以全是f0,f1,f2,…,你只能對照資料檔案看誰是第0個feature誰是第1個了)
相關文章
- xgboost特徵重要性特徵
- 用xgboost模型對特徵重要性進行排序模型特徵排序
- 【特徵工程】(資料)使用Xgboost篩選特徵重要性特徵工程
- xgboost 特徵重要性計算特徵
- XGBoost 輸出特徵重要性以及篩選特徵特徵
- xgboost 特徵重要性選擇 / 看所有特徵哪個重要特徵
- XGBoost學習(六):輸出特徵重要性以及篩選特徵特徵
- 用xgboost獲取特徵重要性及應用特徵
- xgboost模型特徵重要性的不同計算方式模型特徵
- 用xgboost獲取特徵重要性原理及實踐特徵
- xgboost輸出特徵重要性排名和權重值特徵
- 分別利用xgbboost和catboost演算法做特徵重要性排序演算法特徵排序
- 【演算法】關於xgboost特徵重要性的評估演算法特徵
- 使用xgboost進行特徵選擇特徵
- xgboost特徵選擇特徵
- xgboost 特徵選擇,篩選特徵的正要性特徵
- RF、GBDT、XGboost特徵選擇方法特徵
- [特徵工程系列一] 論特徵的重要性特徵工程
- 使用XGBoost在Python中的功能重要性和功能選擇Python
- 機器學習之 基於xgboost的特徵篩選機器學習特徵
- xgboost 設定每條資料的重要性
- Python中XGBoost的特性重要性和特性選擇Python
- xgboost get_fscore 判斷特徵重要程度的三種指標特徵指標
- XGBoost類庫使用小結
- 使用索引掃描來進行排序索引排序
- 線性模型已退場,XGBoost時代早已來模型
- python技巧 使用值來排序一個字典Python排序
- 機器學習的未來——深度特徵融合機器學習特徵
- 如何用Python做自動化特徵工程Python特徵工程
- 使用scikit-learn機器學習庫裡面的xgboost機器學習
- 使用Tkinter模組來建立簡單的GUI程式GUI
- 使用JavaBean來做Facade模式是否可行?JavaBean模式
- python之排序操作及heapq模組Python排序
- [PY3]——heap模組 和 堆排序排序
- 使用Vue+Django+Ant Design做一個留言評論模組VueDjango
- asp.net core 使用 TestServer 來做整合測試ASP.NETServer
- python pandas做資料分析檢視分析matplotlib,seaborn模組使用Python
- sklearn與XGBoost庫xgboost演算法引數總結演算法