《機器學習:演算法原理和程式設計實踐》3:決策樹的發展
1、決策樹的演算法框架
決策樹的主函式
計算最優特徵子函式:ID3用資訊增益、C4.5用資訊增益率、CART用節點方差的大小等。
資訊熵:用來表示任何一種能量在空間中分佈的均勻程度。能量分佈得越均勻,熵就越大。在決策樹中,它不僅能用來度量類別的不確定性,也可以用來度量包含不同特徵的資料樣本與類別的不確定性。
CART演算法是目前決策樹演算法中最為成熟的一類演算法,應用範圍也比較廣泛。
在迴歸樹中,資料集均為連續性的。連續資料的處理方法與離散資料不同,離散資料是按每個特徵的取值來劃分,而連續特徵則要計算出最優劃分點。但在連續資料集上計算線性相關度非常簡單,演算法思想來源於最小二乘法。
剪枝策略:因為使用連續性資料,CART可以生長出大量的分支樹,為了避免過擬合的問題,預測樹採用了剪枝的方法。主流的剪枝方法有兩類:先剪枝和後剪枝。先剪枝給出一個預定義的劃分閾值,當節點的劃分子集某個標準低於預定義的閾值時,子集劃分將終止。後剪枝在完全生成的決策樹上,根據一定的規則標準,剪掉樹中不具備一般代表性的子樹,使用葉子節點取而代之,進而形成一顆規模較小的新樹。
相關文章
- 機器學習之決策樹原理和sklearn實踐機器學習
- 【Python機器學習實戰】決策樹和整合學習(二)——決策樹的實現Python機器學習
- 決策樹在機器學習的理論學習與實踐機器學習
- 《機器學習:演算法原理和程式設計實踐》4:推薦系統原理機器學習演算法程式設計
- 機器學習之決策樹演算法機器學習演算法
- 機器學習:決策樹機器學習
- 【機器學習】--決策樹和隨機森林機器學習隨機森林
- 【Python機器學習實戰】決策樹和整合學習(一)Python機器學習
- 機器學習|決策樹-sklearn實現機器學習
- 《機器學習:演算法原理和程式設計實踐》2:中文文字分類機器學習演算法程式設計文字分類
- 機器學習之決策樹ID3(python實現)機器學習Python
- 機器學習——決策樹模型機器學習模型
- 機器學習之決策樹機器學習
- 機器學習(五):通俗易懂決策樹與隨機森林及程式碼實踐機器學習隨機森林
- 機器學習——決策樹模型:Python實現機器學習模型Python
- 機器學習經典演算法之決策樹機器學習演算法
- Python機器學習:決策樹001什麼是決策樹Python機器學習
- 機器學習之決策樹在sklearn中的實現機器學習
- 機器學習筆記(四)決策樹機器學習筆記
- 機器學習Sklearn系列:(三)決策樹機器學習
- 機器學習之 決策樹(Decision Tree)python實現機器學習Python
- 【Python機器學習實戰】決策樹與整合學習(六)——整合學習(4)XGBoost原理篇Python機器學習
- 機器學習實戰(三)決策樹ID3:樹的構建和簡單分類機器學習
- 機器學習 Day 9 | 決策樹基礎機器學習
- 《機器學習Python實現_09_02_決策樹_CART》機器學習Python
- 通用機器學習演算法:線性迴歸+決策樹+Xgboost機器學習演算法
- 【Python機器學習實戰】決策樹與整合學習(三)——整合學習(1)Python機器學習
- 機器學習演算法系列(十七)-決策樹學習演算法(Decision Tree Learning Algorithm)機器學習演算法Go
- 機器學習 - 決策樹:技術全解與案例實戰機器學習
- 【Python機器學習實戰】決策樹與整合學習(四)——整合學習(2)GBDTPython機器學習
- 圖解機器學習 | 決策樹模型詳解圖解機器學習模型
- 【機器學習】實現層面 決策樹 並用graphviz視覺化樹機器學習視覺化
- 機器學習之支援向量機原理和sklearn實踐機器學習
- 《機器學習Python實現_09_01_決策樹_ID3與C4.5》機器學習Python
- 《統計學習方法》——從零實現決策樹
- 機器學習之使用sklearn構造決策樹模型機器學習模型
- 機器學習之決策樹詳細講解及程式碼講解機器學習
- 鵝廠優文 | 決策樹及ID3演算法學習演算法