決策樹歸納分類演算法理解
決策樹歸納分類演算法理解
決策樹歸納是從類標記的訓練資料構建決策樹,屬於分類領域。遍歷根節點到全部葉節點的路徑,每條路徑都屬於一個元組分類。整棵決策樹形成分類規則。目前構造決策樹的演算法包括ID3(iterative dichotomy),C4.5,CART,都基於如下抽象的演算法流程,現通過一個詳細的資料集對演算法進行詳細解釋:
該演算法名稱Generate_decision_tree(,,),遞迴進行決策樹構建。
Input:
資料劃分D,即訓練資料,包含訓練元組(tuples)和對應類標記。
attribute_list是候選屬性集
attribute_selection_method 確定分裂準則splitting_criterion(確定將哪個屬性作為第一分裂屬性,應該是最合適的分裂屬性),包含確定分裂屬性和分裂子集/分裂點。
(分裂點:針對連續型元組(每一行資料代表一個元組);分裂子集:針對離散的資料)
Output:
決策樹
該資料集就是資料劃分D,包含4個屬性和及其對應的類標記。
attribute_list是{age,income,student,credit_rating}構成的候選屬性集合。資料劃分是根據屬性選擇度量(Gain、Gainratio、Gini指標)依次選取最合適的屬性作為分裂屬性。
以ID3演算法為例:
分別計算四個屬性的資訊增益值:Gain(age)、Gain(income)、Gain(student), Gain(credit_rating) (具體求解見博文……)得到Gain(age)最高,故其被選為第一個最合適的分裂屬性,其有三個分裂子集,分別對應youth、middle_aged、senior構成的子資料集。
演算法中j表示屬性age的三個值youth、middle_aged、senior。
Dj表示按這三個值分類對應的新資料劃分,如下:
j的值就是age屬性擁有的值的個數,構成了新的資料劃分。然後分別針對D1,D2,D3遞迴呼叫Generate_decision_tree(,,)
遞迴出口:
1.Di中的元組都屬於同一類,直接將其所屬的類作為葉節點
2. 候選屬性集attribute_list為空,將Di中的多數類作為葉節點。
相關文章
- 分類演算法-決策樹 Decision Tree演算法
- 分類——決策樹模型模型
- 決策樹演算法演算法
- 關於決策樹的理解
- 通用機器學習演算法:線性迴歸+決策樹+Xgboost機器學習演算法
- 決策樹模型(4)Cart演算法模型演算法
- 決策樹演算法-實戰篇演算法
- 決策樹演算法-理論篇演算法
- 從“數學歸納法”到理解“遞迴演算法”!遞迴演算法
- 決策樹
- 從線性模型到決策樹再到深度學習的分位數迴歸模型深度學習
- 機器學習演算法(五):基於企鵝資料集的決策樹分類預測機器學習演算法
- 決策樹模型(3)決策樹的生成與剪枝模型
- 分類演算法-邏輯迴歸與二分類演算法邏輯迴歸
- 決策樹示例
- 指南:不平衡分類的成本敏感決策樹(附程式碼&連結)
- Reinventing the wheel:決策樹演算法的實現演算法
- 機器學習之決策樹演算法機器學習演算法
- 決策樹演算法的推理與實現演算法
- 機器學習實戰(三)決策樹ID3:樹的構建和簡單分類機器學習
- 機器學習西瓜書吃瓜筆記之(二)決策樹分類 附一鍵生成決策樹&視覺化python程式碼實現機器學習筆記視覺化Python
- 4. 決策樹
- Decision tree——決策樹
- 決策樹(Decision Tree)
- SKlearn中分類決策樹的重要引數詳解
- 演算法金 | 突破最強演算法模型,決策樹演算法!!演算法模型
- Python機器學習:決策樹001什麼是決策樹Python機器學習
- 機器學習——線性迴歸-KNN-決策樹(例項)機器學習KNN
- 分類演算法(1)-LR邏輯迴歸演算法邏輯迴歸
- Android事件分發原始碼歸納Android事件原始碼
- 通俗地說決策樹演算法(二)例項解析演算法
- 機器學習經典演算法之決策樹機器學習演算法
- 最常用的決策樹演算法!Random Forest、Adaboost、GBDT 演算法演算法randomREST
- Kotlin知識歸納(四) —— 介面和類Kotlin
- ML《決策樹(三)CART》
- 機器學習:決策樹機器學習
- 決策樹學習總結
- 決策樹和隨機森林隨機森林
- 什麼是機器學習分類演算法?【K-近鄰演算法(KNN)、交叉驗證、樸素貝葉斯演算法、決策樹、隨機森林】機器學習演算法KNN隨機森林