機器學習——決策樹模型
談起 過年 回家的年輕人最怕什麼、最煩 什麼?無外乎 就是面對 那些七大姑、八大姨的催結婚、催生子、催相親、催買房 …… 說起這些親戚們是如何判斷催什麼,不得不讓我們想起經典的決策樹模型。
決策樹是一個用於分類和迴歸的機器學習模型。透過對輸入 物件 資料特徵進行一系列 條件劃分 構建一個樹狀結構的決策模型。每個內部節點表示一個特徵或屬性,每個分支代表該特徵的一個可能取值,而每個葉節點代表一個類別標籤或數值輸出。 我們的親戚就是透過條件分類,從而判斷出 “催什麼”。
決策樹的構建過程通常從根節點開始,根據某個特徵的取值將資料集分成不同的子集。然後對每個子集遞迴地應用相同的步驟,直到滿足某個停止條件,例如達到最大深度、子集樣本數量小於某個閾值等。在構建過程中,可以使用不同的劃分準則來選擇最優的特徵和劃分點,例如資訊增益、基尼指數等。
決策樹的優點包括可解釋性強、處理離散和連續特徵都較好、對缺失值和異常值有較好的容錯能力。然而,決策樹容易過擬合、對於某些問題可能存在區域性最優解,並且對於特徵之間的關聯關係不夠敏感。
為了減少過擬合,可以採用剪枝操作,即透過降低模型複雜度來提高泛化能力。常見的剪枝方法有預剪枝和後剪枝。預剪枝在構建過程中進行模型評估,若劃分不再有效則停止劃分;後剪枝則先構建完整的決策樹,然後透過剪去子樹並比較泛化能力來判斷是否進行剪枝操作。
決策樹模型經典的演算法一般認為包含: ID3 演算法 、 C4.5 演算法 、 CART 演算法 。
ID3 演算法 : 核心是在決策樹各個節點上應用資訊增益準則選擇特徵,遞迴地構建決策樹。演算法表示如下:
C4.5 演算法 : 在生成決策樹的過程中,改用資訊增益比來選擇特徵。 簡單說是透過輸入訓練資料集、 特徵集A 、 閾值 ,從而輸出:決策樹 T 。
CART 演算法 : 由特徵選擇既可用於分類也可用於迴歸,透過構建樹、修剪樹、評估樹來構建二叉樹。當終結點是連續變數時,該樹為迴歸樹;當終結點是分類變數,該樹為分類樹 。
來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/70031268/viewspace-3001550/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 圖解機器學習 | 決策樹模型詳解圖解機器學習模型
- 機器學習之決策樹機器學習
- 人工智慧之機器學習基礎——決策樹(Decision Tree)人工智慧機器學習
- 機器學習 - 決策樹:技術全解與案例實戰機器學習
- 決策樹模型(3)決策樹的生成與剪枝模型
- 機器學習演算法系列(十七)-決策樹學習演算法(Decision Tree Learning Algorithm)機器學習演算法Go
- 使用 SVM 和決策樹進行整合學習
- 決策樹模型(2)特徵選擇模型特徵
- 機器學習模型機器學習模型
- 決策樹模型(4)Cart演算法模型演算法
- 決策樹模型(1)總體介紹模型
- 決策樹
- 機器學習演算法(五):基於企鵝資料集的決策樹分類預測機器學習演算法
- 機器學習演算法系列(二十)-梯度提升決策樹演算法(Gradient Boosted Decision Trees / GBDT)機器學習演算法梯度
- 決策樹演算法演算法
- 機器學習【模型,策略,演算法】機器學習模型演算法
- AI決策進階:深度學習遷移技術賦能決策AI深度學習
- [模式識別複習筆記] 第8章 決策樹模式筆記
- 關於決策樹的理解
- 圖解機器學習 | LightGBM模型詳解圖解機器學習模型
- 分散式機器學習中的模型聚合分散式機器學習模型
- 機器學習-學習筆記(二) --> 模型評估與選擇機器學習筆記模型
- 大資料————決策樹(decision tree)大資料
- 分散式機器學習中的模型架構分散式機器學習模型架構
- 演算法金 | 突破最強演算法模型,決策樹演算法!!演算法模型
- TensorFlow Serving: 高效能機器學習模型部署利器機器學習模型
- 機器學習機器學習
- 「馬爾可夫決策過程」學習筆記馬爾可夫筆記
- 什麼是機器學習分類演算法?【K-近鄰演算法(KNN)、交叉驗證、樸素貝葉斯演算法、決策樹、隨機森林】機器學習演算法KNN隨機森林
- 機器學習-整合學習LightGBM機器學習
- 機器學習:監督學習機器學習
- 什麼是機器學習的分類演算法?【K-近鄰演算法(KNN)、交叉驗證、樸素貝葉斯演算法、決策樹、隨機森林】機器學習演算法KNN隨機森林
- 【機器學習】李宏毅——機器學習任務攻略機器學習
- Python 機器學習 HMM模型三種經典問題Python機器學習HMM模型
- 使用pmml實現跨平臺部署機器學習模型機器學習模型
- 機器學習中的元學習機器學習
- 機器學習&深度學習 操作tips機器學習深度學習
- 機器學習(2)機器學習