ML-熵、條件熵、資訊增益

透明的胡蘿蔔發表於2019-03-29

原文網址 : https://blog.csdn.net/a18730290353/article/details/88903150

熵

通俗理解條件熵

特徵選擇之資訊增益法（必看！系統介紹了熵、條件熵、資訊增益的概念及推導）

條件熵的計算（必看！知乎前三個回答都看一下，有關於熵、條件熵、資訊增益的實踐）

我通過例子一步一步講解這個概念。

在決策樹演算法的學習過程中，資訊增益是特徵選擇的一個重要指標，它定義為一個特徵能夠為分類系統帶來多少資訊，帶來的資訊越多，說明該特徵越重要，相應的資訊增益也就越大。

概念

熵：

我們前面說了，資訊熵是代表隨機變數的複雜度（不確定度）通俗理解資訊熵 - 知乎專欄，條件熵代表在某一個條件下，隨機變數的複雜度（不確定度）通俗理解條件熵 - 知乎專欄。

而我們的資訊增益恰好是：資訊熵-條件熵。

換句話說，資訊增益代表了在一個條件下，資訊複雜度（不確定性）減少的程度。

那麼我們現在也很好理解了，在決策樹演算法中，我們的關鍵就是每次選擇一個特徵，特徵有多個，那麼到底按照什麼標準來選擇哪一個特徵。

這個問題就可以用資訊增益來度量。如果選擇一個特徵後，資訊增益最大（資訊不確定性減少的程度最大），那麼我們就選取這個特徵。

例子

我們有如下資料：

可以求得隨機變數X（嫁與不嫁）的資訊熵為：

嫁的個數為6個，佔1/2，那麼資訊熵為-1/2log1/2-1/2log1/2 = -log1/2=0.301

現在假如我知道了一個男生的身高資訊。

身高有三個可能的取值{矮，中，高}

矮包括{1,2,3,5,6,11,12}，嫁的個數為1個，不嫁的個數為6個

中包括{8,9} ，嫁的個數為2個，不嫁的個數為0個

高包括{4,7,10}，嫁的個數為3個，不嫁的個數為0個

先回憶一下條件熵的公式如下：

我們先求出公式對應的:

H(Y|X = 矮) = -1/7log1/7-6/7log6/7=0.178

H(Y|X=中) = -1log1-0 = 0

H(Y|X=高） = -1log1-0=0

p(X = 矮) = 7/12,p(X =中) = 2/12,p(X=高) = 3/12

則可以得出條件熵為：

7/12*0.178+2/12*0+3/12*0 = 0.103

那麼我們知道資訊熵與條件熵相減就是我們的資訊增益，為

0.301-0.103=0.198

所以我們可以得出我們在知道了身高這個資訊之後，資訊增益是0.198

結論

我們可以知道，本來如果我對一個男生什麼都不知道的話，作為他的女朋友決定是否嫁給他的不確定性有0.301這麼大。

當我們知道男朋友的身高資訊後，不確定度減少了0.198.也就是說，身高這個特徵對於我們廣大女生同學來說，決定嫁不嫁給自己的男朋友是很重要的。

至少我們知道了身高特徵後，我們原來沒有底的心裡（0.301）已經明朗一半多了，減少0.198了（大於原來的一半了）。

那麼這就類似於非誠勿擾節目裡面的橋段了，請問女嘉賓，你只能知道男生的一個特徵。請問你想知道哪個特徵。

假如其它特徵我也全算了，資訊增益是身高這個特徵最大。那麼我就可以說，孟非哥哥，我想知道男嘉賓的一個特徵是身高特徵。因為它在這些特徵中，對於我挑夫君是最重要的，資訊增益是最大的，知道了這個特徵，嫁與不嫁的不確定度減少的是最多的。

哈哈，希望能對理解資訊增益有所幫助

資訊熵概念隨筆——資訊熵、資訊的熵
2018-07-24
熵
熵、資訊量、資訊熵、交叉熵-個人小結
2019-03-01
熵
資訊熵（夏農熵）
2020-10-11
熵
熵、聯和熵與條件熵、交叉熵與相對熵是什麼呢？詳細解讀這裡有！
2020-07-29
熵
資訊熵，交叉熵與KL散度
2021-06-29
熵
基於條件熵的特徵選擇
2020-08-09
熵特徵
Python | 資訊熵 Information Entropy
2024-03-09
Python熵ORM
近似熵-樣本熵-多尺度熵
2020-08-23
熵
熵，交叉熵，Focalloss
2024-07-24
熵
ML-邏輯迴歸-Softmax-交叉熵（小航）
2019-02-27
邏輯迴歸熵
夏農熵-互資訊-entropy
2024-10-09
熵
資訊理論之從熵、驚奇到交叉熵、KL散度和互資訊
2023-04-15
熵
資訊熵相關知識總結
2018-12-18
熵
最大熵模型
2018-03-06
熵模型
熵增定律
2024-07-09
熵
熵、交叉熵及似然函式的關係
2019-07-31
熵函式
【機器學習基礎】熵、KL散度、交叉熵
2018-09-27
機器學習熵
Consul的反熵
2019-08-14
熵
資訊增益
2020-10-01
2024熵密杯wp
2024-10-07
熵
重新理解熵編碼
2024-06-26
熵
交叉熵損失CrossEntropyLoss
2023-02-20
熵ROS
[熵值] 解題報告
2024-10-18
熵
0815鮮花——熵增定律
2024-08-15
熵
python中如何實現資訊增益和資訊增益率
2021-09-11
Python
熵不起得隨機數
2020-08-19
熵隨機
Tensorflow-交叉熵&過擬合
2021-01-28
熵
程式設計世界的熵增原理
2019-02-25
程式設計熵
談談交叉熵損失函式
2019-04-12
熵函式
關於交叉熵的個人理解
2019-02-18
熵
大系統觀:1.3無序就是熵增
2018-05-25
熵
最大熵模型詳解與Python實現
2020-11-06
熵模型Python
決策樹詳解，從熵說起
2020-10-25
熵
熵編碼(四)-算術編碼(二)
2024-08-03
熵
01 決策樹 - 數學理論概述 - 熵
2018-10-29
熵
今日面試題分享：什麼是最大熵
2019-03-11
面試題熵
圖示Softmax及交叉熵損失函式
2018-09-14
熵函式
ETV全球熵系統技術開發方案
2020-08-18
熵

ML-熵、條件熵、資訊增益

概念

例子

結論

相關文章