機器學習——提升方法AdaBoost演算法，推導過程

Lily發表於2019-05-09

原文網址 : https://www.cnblogs.com/baby-lily/p/10841112.html

0提升的基本方法

　　對於分類的問題，給定一個訓練樣本集，求比較粗糙的分類規則（弱分類器）要比求精確的分類的分類規則（強分類器）容易的多。提升的方法就是從弱分類器演算法出發，反覆學習，得到一系列弱分類器（又稱為基本分類器），然後組合這些弱分類器，構成一個強分類器。大多數的提升方法都是改變訓練資料集的概率分佈（訓練資料的權值分佈），針對不同的訓練資料分佈呼叫弱學習演算法學習一系列弱分類器。

　　這樣，對於提升方法來說，有兩個問題需要回答：一是在每一輪如何改變訓練資料的權值或概率分佈，二是如何將弱分類器組合成一個強分類器。對於第一個問題，AdaBoost的做法是提高那些被前一輪弱分類器錯誤分類樣本的權值，降低那些被正確分類的樣本的權值。如此，那些被分類錯誤的樣本將更加受到關注。對於第二個問題，AdaBoost採取多數表決的法法，具體的，加大分類誤差率小的弱分類器的權值，使其的作用較大，減小那些分類錯誤率大的分類器的權值，使其在表決中起較小的作用。

1.AdaBoost演算法

AdaBoost演算法從訓練資料中學習一系列弱分類器或者基本分類器，並將這些分類器進行線性組合。

輸入：訓練資料集T={(x1,y1),(x2,y2),(x3,y3)......}，y的類別為{-1，1}

輸出：最終的分類器G(x)

　　（1）初始化訓練資料的權值分佈

　　（2）對m=1，2，.....，M

　　　　　　（a）使用具有權值分佈的Dm訓練資料集進行學習，得到基本分類器

　　　　　　（b）計算Gm(x)在訓練資料集上的分類誤差率

　　　　　　（c）計算Gm(x)的係數

　　這裡的對數是自然對數

　　　　　　　（d）更新訓練資料集的權值分佈

　　其中，Zm是歸一化因子。

　　（3）構建基本的分類器的線性組合

　　得到最終的分類器：

2演算法詳解

　　對於演算法做如下的解釋：

　　對於原始的資料集，假設其為均勻分佈，則能夠在原始資料集上面得到基本分類器。得到的權值通過改變分類誤差率進而改變分類器的係數，對於基本分類器Gm(x)的係數am，am表示Gm(x)在最終分類器的重要性，當em<=0.5時，am>0，am隨著em的減小而增大，所以分類誤差率越小的基本分類器在最終的分類器的作用越大。

　　M個分類器的加權表決，係數am表示了基本分類器GM(x)的重要性，am之和並不為1，由f(x)的符號決定例項x的類，f(x)的絕對值表示分類的確信度。

機器學習演算法：AdaBoost
2020-09-25
機器學習演算法
【機器學習】邏輯迴歸過程推導
2019-02-15
機器學習邏輯迴歸
機器學習 — AdaBoost演算法（手稿+程式碼）
2018-09-15
機器學習演算法
機器學習導圖系列（3）：過程
2019-04-09
機器學習
08_提升方法_AdaBoost演算法
2020-06-05
演算法
機器學習分享——反向傳播演算法推導
2019-04-28
機器學習反向傳播演算法
機器學習反向傳播演算法的數學推導
2018-12-09
機器學習反向傳播演算法
【機器學習】--Adaboost從初始到應用
2018-04-08
機器學習
Boosting提升演算法之AdaBoost
2020-11-14
演算法
數學推導+Python實現機器學習演算法：線性迴歸
2018-09-27
Python機器學習演算法
統計學習方法——實現AdaBoost
2021-04-23
數學推導+純Python實現機器學習演算法：邏輯迴歸
2019-03-03
Python機器學習演算法邏輯迴歸
MCMC-2|機器學習推導系列（十六）
2020-10-06
機器學習
機器學習/深度學習書單推薦及學習方法
2018-04-12
機器學習深度學習
【機器學習】機器學習建立演算法第1篇：機器學習演算法課程定位、目標【附程式碼文件】
2024-03-11
機器學習演算法
機器學習 | 深入SVM原理及模型推導（一）
2020-08-26
機器學習模型
03整合學習-Boosting-AdaBoost演算法原理
2018-11-19
演算法
【方法論】機器學習演算法概覽
2018-08-01
機器學習演算法
機器學習--白板推導系列筆記1 開篇
2019-04-08
機器學習筆記
機器學習演算法迴避了科學方法 - thenewstack
2021-09-08
機器學習演算法
《機器學習Python實現_10_02_整合學習_boosting_adaboost分類器實現》
2021-05-04
機器學習Python
機器學習深版04：提升
2020-12-07
機器學習
支援向量機推導過程，還算比較容易懂
2020-12-11
機器學習入門學習筆記：（2.1）線性迴歸理論推導
2019-02-15
機器學習筆記
機器學習演算法
2018-03-27
機器學習演算法
為什麼清華、北大、麻省理工碩博士，都要逐步推導機器學習演算法？
2018-09-27
機器學習演算法
機器學習導圖系列（4）：演算法(含61公式)
2019-04-10
機器學習演算法公式
機器學習演算法學習筆記
2023-03-13
機器學習演算法筆記
機器學習課程筆記
2018-05-15
機器學習筆記
強化學習-學習筆記7 | Sarsa演算法原理與推導
2022-07-07
強化學習筆記演算法
分享一些自己的學習過程和學習方法
2019-05-22
【機器學習】新手必看的十種機器學習演算法
2018-03-12
機器學習演算法
演算法--我的紅黑樹學習過程
2018-12-27
演算法
Python遷移學習：機器學習演算法
2020-12-16
Python遷移學習機器學習演算法
從 0 開始機器學習 - 機器學習演算法診斷
2020-07-16
機器學習演算法
機器學習之迭代方法
2020-06-12
機器學習
【數學】主成分分析（PCA）的詳細深度推導過程
2024-04-23
PCA
隨機過程學習筆記——概論
2020-10-06
隨機筆記

機器學習——提升方法AdaBoost演算法，推導過程

相關文章