《機器學習:演算法原理和程式設計實踐》3:決策樹的發展
1、決策樹的演算法框架
決策樹的主函式
計算最優特徵子函式:ID3用資訊增益、C4.5用資訊增益率、CART用節點方差的大小等。
資訊熵:用來表示任何一種能量在空間中分佈的均勻程度。能量分佈得越均勻,熵就越大。在決策樹中,它不僅能用來度量類別的不確定性,也可以用來度量包含不同特徵的資料樣本與類別的不確定性。
CART演算法是目前決策樹演算法中最為成熟的一類演算法,應用範圍也比較廣泛。
在迴歸樹中,資料集均為連續性的。連續資料的處理方法與離散資料不同,離散資料是按每個特徵的取值來劃分,而連續特徵則要計算出最優劃分點。但在連續資料集上計算線性相關度非常簡單,演算法思想來源於最小二乘法。
剪枝策略:因為使用連續性資料,CART可以生長出大量的分支樹,為了避免過擬合的問題,預測樹採用了剪枝的方法。主流的剪枝方法有兩類:先剪枝和後剪枝。先剪枝給出一個預定義的劃分閾值,當節點的劃分子集某個標準低於預定義的閾值時,子集劃分將終止。後剪枝在完全生成的決策樹上,根據一定的規則標準,剪掉樹中不具備一般代表性的子樹,使用葉子節點取而代之,進而形成一顆規模較小的新樹。
相關文章
- 機器學習之決策樹原理和sklearn實踐機器學習
- 《機器學習:演算法原理和程式設計實踐》4:推薦系統原理機器學習演算法程式設計
- 《機器學習實戰》決策樹(ID3演算法)的分析與實現機器學習演算法
- 【Python機器學習實戰】決策樹和整合學習(二)——決策樹的實現Python機器學習
- 機器學習之決策樹演算法機器學習演算法
- 決策樹ID3演算法python實現 -- 《機器學習實戰》演算法Python機器學習
- 決策樹在機器學習的理論學習與實踐機器學習
- 《機器學習:演算法原理和程式設計實踐》2:中文文字分類機器學習演算法程式設計文字分類
- 機器學習:決策樹機器學習
- 機器學習-決策樹機器學習
- 機器學習|決策樹-sklearn實現機器學習
- 決策樹演算法原理(上)演算法
- 決策樹演算法原理(下)演算法
- 機器學習之決策樹ID3(python實現)機器學習Python
- 【機器學習】--決策樹和隨機森林機器學習隨機森林
- 機器學習經典演算法之決策樹機器學習演算法
- 機器學習——決策樹模型機器學習模型
- 機器學習之決策樹機器學習
- 機器學習(五):通俗易懂決策樹與隨機森林及程式碼實踐機器學習隨機森林
- 機器學習筆記之資訊熵、資訊增益和決策樹(ID3演算法)機器學習筆記熵演算法
- 機器學習——決策樹模型:Python實現機器學習模型Python
- 機器學習筆記--決策樹機器學習筆記
- 決策樹模型(3)決策樹的生成與剪枝模型
- 機器學習實戰(三)決策樹ID3:樹的構建和簡單分類機器學習
- 機器學習之決策樹在sklearn中的實現機器學習
- 從決策樹到隨機森林:樹型演算法的原理與實現隨機森林演算法
- 【Python機器學習實戰】決策樹和整合學習(一)Python機器學習
- Python機器學習:決策樹001什麼是決策樹Python機器學習
- 機器學習Sklearn系列:(三)決策樹機器學習
- 機器學習筆記(四)決策樹機器學習筆記
- 決策樹演算法-實戰篇演算法
- 決策樹演算法演算法
- 決策樹演算法的推理與實現演算法
- 機器學習之 決策樹(Decision Tree)python實現機器學習Python
- 第四篇:決策樹分類演算法原理分析與程式碼實現演算法
- 決策樹ID3分類演算法的C++實現演算法C++
- 機器學習 Day 9 | 決策樹基礎機器學習
- 04 ML 決策樹入門 ID3 演算法實現演算法