分類演算法-AdaBoot 演算法

娃哈哈店長發表於2020-01-17

原文網址 : https://learnku.com/articles/39872?order_by=created_at&

AdaBoost 是英文"Adaptive Boosting"（自適應增強）的縮寫，是一種迭代演算法，其核心思想是針對同一個訓練集訓練不同的分類器 ( 弱分類器 )，然後把這些弱分類器集合起來，構成一個更強的最終分類器（強分類器）。AdaBoost 是 Adaptive Boosting（自適應）的縮寫，它的自適應在於：前一個基本分類器分錯的樣本會得到加強，加權後的樣本再次被用來訓練下一個基本分類器。同時，在每一輪中加入一個新的弱分類器，直到達到某個預定的足夠小的錯誤率，或者達到預先設定的最大迭代次數。

0x00弱分類器和分類器

當一個分類器的正確率不那麼高的時候，稱之為弱分類器，或者說該分類器的學習方法為若學習方法。與之對應的，存在強分類器和強學習方法。強學習方法的正確率很高。

常見的機器學習演算法都可以建立弱分類器，不過最經常使用的弱分類器是單層決策樹。單層決策樹又稱為決策樹樁(Decision Stump)，即層數為1的決策樹。

下面距離得演算法使用單層決策樹作為弱分類器。每一個訓練資料都有一一個權值係數，注意不是弱
分類器的係數。建立最佳單層決策樹的依據就是:每個訓練資料在單層決策樹中的分類結果乘以自己的權值係數後相加的“和”最小，即分類誤差最小化。

0x01AdaBoost迭代演算法步驟

具體說來，整個AdaBoost迭代演算法分為以下3步。

①初始化訓練資料的權值分佈。如果有N個樣本，則每一一個訓練樣本最開始時都被賦予相同的權重: 1/N。

②訓練弱分類器。具體訓練過程中，如果某個樣本點已經被準確分類，那麼在構造下-個訓練集中，它的權重就被降低;相反，如果某個樣本點沒有被準確分類，那麼它的權重就得到提高。然後，權重更新過的樣本集被用於訓練下一一個分類器，整個訓練過程如此迭代進行下去。

③將各個訓練得到的弱分類器組合成強分類器。各個弱分類器的訓練過程結束後，加大分類誤差率小的弱分類器的權重，使其在最終的分類函式中起著較大的決定作用，而降低分類誤差率大的弱分類器的權重,使其在最終的分類函式中起著較小的決定作用。換言之，誤差率低的弱分類器在最終分類器中佔的權重較大，否則較小。

其執行過程為:訓練資料中的每個樣本，並賦予一開始相等的權重，這些權重構成了向量D.首先在訓練資料上訓練一個弱分類器並計算分類器的錯誤率，然後在同一資料集上再次訓練弱分類器。在第二次訓練分類器中，會再次重新調整每個樣本的權重，其中第- -次分類錯誤的權重會提高，而第一次分類樣本的權重會降低。AdaBoost根據每個弱分類器的錯誤率進行計算，為每個分類器都配了一一個權重a.

計算出D後，AdaBoost又開始進行下一輪迭代，AdaBoost演算法會不斷地重複訓練和調正權重，知道訓練錯誤率為0，或者說弱分類器地數目達到使用者地指定值
分類問題-k-近鄰演算法樸素貝葉斯支援向量機 AdaBoot演算法決策樹多層感知機

上圖中，左邊是資料集，其中直方圖得不同寬度表示每個案例上得不同權重，在經過一個分類器之後，會通過圖形中得a（阿爾法）值進行加權，經過加權後再進行求和，從而得到輸出結果，

本作品採用《CC 協議》，轉載必須註明作者和本文連結

文章！！首發於我的部落格Stray_Camel(＾Ｕ＾)ノ~ＹＯ。

codetop演算法分類
2024-09-05
演算法
分類演算法-k 鄰近演算法
2020-01-19
演算法
KNN演算法——分類部分
2019-06-29
KNN演算法
分類演算法-邏輯迴歸與二分類
2022-04-05
演算法邏輯迴歸
目標跟蹤演算法分類
2018-08-19
演算法
分類演算法-支援向量機 SVM
2020-01-19
演算法
分類演算法-決策樹 Decision Tree
2020-01-18
演算法
分類演算法-樸素貝葉斯
2020-01-17
演算法
分類演算法的評估指標
2020-04-06
演算法指標
分類模型的演算法效能評價
2024-07-09
模型演算法
最基礎的分類演算法（KNN）
2021-09-09
演算法KNN
演算法影像崗-影像分類與影像分割
2020-11-08
演算法
20分鐘學會DBSCAN聚類演算法
2024-07-16
聚類演算法
分類演算法（1）-LR邏輯迴歸
2021-09-09
演算法邏輯迴歸
演算法實踐：KNN分類（day08）
2020-12-22
演算法KNN
機器學習3-分類演算法
2021-01-18
機器學習演算法
SVM分類器演算法總結&應用
2020-12-13
演算法
機器學習--有監督學習--分類演算法（預測分類）
2024-06-18
機器學習演算法
什麼是Python演算法?分為哪幾類?
2021-06-02
Python演算法
機器學習4-分類演算法2
2021-01-19
機器學習演算法
聚類演算法
2020-04-26
聚類演算法
NLP概述和文字自動分類演算法詳解
2018-07-25
演算法
分類演算法-多層感知機 Multi-layer Perceptron
2020-01-19
演算法
Python演算法分為哪幾類？具備哪些特徵？
2021-05-07
Python演算法特徵
資料探勘——KNN演算法（手寫數字分類）
2020-12-20
KNN演算法
演算法基礎---二分演算法
2021-01-25
演算法
聚類演算法——DBSCAN演算法原理及公式
2020-05-20
聚類演算法公式
簡單易懂的樸素貝葉斯分類演算法
2018-09-21
演算法
4.【Python】分類演算法—Factorization Machine（FM，因子分解機）
2020-12-15
Python演算法Mac
二分演算法
2018-08-21
演算法
python演算法：分糖果
2024-05-16
Python演算法
02貝葉斯演算法-案例一-鳶尾花資料分類
2018-12-18
演算法
KNN 演算法-理論篇-如何給電影進行分類
2020-12-02
KNN演算法
聚類演算法綜述
2018-12-09
聚類演算法
OPTICS聚類演算法原理
2020-05-14
聚類演算法
初探DBSCAN聚類演算法
2021-05-22
聚類演算法
14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例
2018-12-16
聚類演算法
聊聊二分演算法
2020-05-30
演算法

分類演算法-AdaBoot 演算法

0x00弱分類器和分類器

0x01AdaBoost迭代演算法步驟

相關文章