模型融合——stacking原理與實現

魚與魚發表於2022-02-14

原文網址 : https://www.cnblogs.com/gongyanzh/p/15891945.html

模型

一般提升模型效果從兩個大的方面入手

資料層面：資料增強、特徵工程等

模型層面：調參，模型融合

模型融合：通過融合多個不同的模型，可能提升機器學習的效能。這一方法在各種機器學習比賽中廣泛應用，也是在比賽的攻堅時刻衝刺Top的關鍵。而融合模型往往又可以從模型結果，模型自身，樣本集等不同的角度進行融合。

模型融合是後期一個重要的環節，大體來說有如下的型別方式：

加權融合（投票、平均）

硬投票

軟投票
boosting/bagging（整合學習）
stacking/blending

本文主要介紹stacking/blending方法的原理，及其實際應用

Stacking模型本質上是一種分層的結構，這裡簡單起見，只分析二級Stacking.假設我們有3個基模型M1、M2、M3。[1]

基模型M1，對訓練集train訓練，然後在訓練集和測試集預測，分別得到P1，T1。同理，得到P2,T2；P3,T3

\[\begin{pmatrix} \vdots\\ P1\\ \vdots\\ \end{pmatrix} \begin{pmatrix} \vdots\\ T1\\ \vdots\\ \end{pmatrix}, \begin{pmatrix} \vdots\\ P2\\ \vdots\\ \end{pmatrix} \begin{pmatrix} \vdots\\ T2\\ \vdots\\ \end{pmatrix}, \begin{pmatrix} \vdots\\ P3\\ \vdots\\ \end{pmatrix} \begin{pmatrix} \vdots\\ T3\\ \vdots\\ \end{pmatrix} \]
分別把P1,P2,P3以及T1,T2,T3合併，得到一個新的訓練集和測試集train2,test2.
再用第二層的模型M4訓練train2,預測test2,得到最終的標籤列。

注意：

用整個訓練集訓練的模型反過來去預測訓練集的標籤，毫無疑問過擬合是非常非常嚴重的，因此現在的問題變成了如何在解決過擬合的前提下得到P1、P2、P3，這就變成了熟悉的節奏——K折交叉驗證。

上圖的模型1-5其實是一個模型在不同折下訓練。

最終的程式碼是兩層迴圈，第一層迴圈控制基模型的數目，每一個基模型要這樣去得到P1，T1，第二層迴圈控制的是交叉驗證的次數K，對每一個基模型，會訓練K次最後拼接得到P1，取平均得到T1。

python實現[2]

### 6折stacking
n_folds = 6
skf = StratifiedKFold(n_splits=n_folds, shuffle=True, random_state=1)
for i,clf in enumerate(clfs):
#     print("分類器：{}".format(clf))
    X_stack_test_n = np.zeros((X_test.shape[0], n_folds))
    for j,(train_index,test_index) in enumerate(skf.split(X_train,y_train)):
                tr_x = X_train[train_index]
                tr_y = y_train[train_index]
                clf.fit(tr_x, tr_y)
                #生成stacking訓練資料集
                X_train_stack [test_index, i] = clf.predict_proba(X_train[test_index])[:,1]
                X_stack_test_n[:,j] = clf.predict_proba(X_test)[:,1]
    #生成stacking測試資料集
    X_test_stack[:,i] = X_stack_test_n.mean(axis=1)

理論介紹推薦閱讀[1]，實現部分可以閱讀[2]

references

【1】【機器學習】模型融合方法概述. https://zhuanlan.zhihu.com/p/25836678

【2】Kaggle提升模型效能的超強殺招Stacking——機器學習模型融合. https://zhuanlan.zhihu.com/p/107655409

模型融合_stacking&blending
2020-12-28
模型
【整合學習】：Stacking原理以及Python程式碼實現
2021-10-17
Python
《機器學習Python實現_10_09_整合學習_bagging_stacking原理及實現》
2021-05-06
機器學習Python
推薦模型NeuralCF：原理介紹與TensorFlow2.0實現
2021-03-27
模型
推薦模型DeepCrossing: 原理介紹與TensorFlow2.0實現
2021-03-14
模型ROS
Lombok 原理與實現
2021-12-29
Lombok
資料探勘實踐（金融風控）：金融風控之貸款違約預測挑戰賽（上篇）[xgboots/lightgbm/Catboost等模型]--模型融合：stacking、blending
2023-05-17
boot模型
在MCU端部署GRU模型實現鼾聲檢測：科技與健康管理的融合
2024-11-02
模型
熔斷原理與實現
2020-10-26
InlineHook & 原理與實現（3）
2021-12-23
inlineHook
@weakify 與 @strongify 實現原理
2022-03-20
堆的原理與實現
2021-09-21
常用的模型整合方法介紹：bagging、boosting 、stacking
2019-05-15
模型
Redis核心原理與實踐--列表實現原理之ziplist
2021-09-16
Redis
memcached分散式原理與實現
2019-02-28
分散式
React基礎與原理實現
2020-11-22
React
vysor原理與程式碼實現
2018-12-25
深入解析 ResNet：實現與原理
2024-11-20
[SentencePiece]Tokenizer的原理與實現
2024-08-26
富集分析的原理與實現
2021-10-29
HashMap 實現原理與原始碼分析
2019-04-26
HashMap原始碼
分散式鎖實現原理與最佳實踐
2023-11-22
分散式
Redis核心原理與實踐--列表實現原理之quicklist結構
2021-09-19
RedisUI
LLM模型融合（一）
2024-10-04
模型
層次分析法模型原理以及程式碼實現
2024-06-27
模型
最大熵模型詳解與Python實現
2020-11-06
熵模型Python
virtual-dom原理與簡單實現
2019-03-04
AQS與JUC中的鎖實現原理
2018-08-31
AQS
Kalman濾波器的原理與實現
2024-04-13
直方圖均衡化原理與實現
2023-12-01
直方圖
Flink Window基本概念與實現原理
2019-08-19
Spring方法注入的使用與實現原理
2020-05-13
Spring
直播特效的實現原理與難點
2018-04-02
特效
告警與恢復告警原理及實現
2023-03-14
【煉丹Trick】EMA的原理與實現
2022-07-10
康擴充開的原理與實現
2021-04-30
WebRTC 音視訊同步原理與實現
2021-03-08
Web
Redis、Zookeeper實現分散式鎖——原理與實踐
2021-11-30
Redis分散式

模型融合——stacking原理與實現

相關文章