用xgboost獲取特徵重要性及應用

NanciZhao發表於2019-11-20

一、xgboost對特徵重要性進行排序的原理(即為什麼xgboost可以對特行的重要性進行排序)

根據結構分數的增益情況,計算選擇哪個特徵的哪個分割點;某個特徵的重要性,就是它在所有樹中出現的次數之和。

二、如何繪製特徵重要性條形圖

三、如何根據特種的重要性進行特徵選擇

特徵選擇的閾值thresh是自己確定的,利用API SelectFromModel(),輸入thresh,再transform data,可對trian,test_data進行特徵提取

相關文章