關於交叉熵的個人理解

宋霖軒發表於2019-02-18

原文網址 : https://juejin.im/post/5c6a98c46fb9a049b13ec2b5

熵

之前雖然使用過cross-entropy函式，但是並不知道它代表的實際意義，只是知道的其能夠進行loss計算，這次從其根源的意義做一個總結，來加深對cross-entropy的理解；

一、熵

對於交叉熵，我們首先要直到熵神馬意思；

熵的意義是一個事件A的自資訊量，也就是A包含多少資訊。對於事件A，越難發生，發生的概率越小，包含的資訊量就越大；例如，中國隊世界盃奪冠，巴西隊世界盃奪冠，肯定前者包含的資訊量最大；

熵的定義如下所示：

可以式子中看出，其也就是所有資訊量的期望；之所以要求和，究其原因是時間獨立，熵可以疊加。其中p代表的x事件發生的概率。

對於單個事件發生的資訊量，可以表示：

由於-log函式的存在，當p趨於0，其值就越大；所以第一個式子也就是多個獨立事件的總期望；

二、KL散度

KL散度是用來衡量兩個分佈之間的不同，其實和歐幾里得距離的性質有點像，只不過其研究的是分佈之間的不同，也稱KL距離。但是注意一點，KL距離沒有對稱性，a和b的KL距離和b和a的KL距離並不相同；

KL散度的定義如下：

第一個子式為離散情況，後一個為連續情況，不同的只是求不求積分；

如果當Pa=Pb時，則兩個事件的分佈完全相同，則KL散度等於0，此時可以理解為兩個分佈完全相同；由於分子分母的關係，也讓KL散度並不具有對稱性。這個可以理解為座標系的不同；

其實觀察上式的後半項，可以看出第一個項其實就是A的熵，第二項就是B在A上的期望；

三、交叉熵： 交叉熵和KL散度公式很相近，如下所示：

其實從這裡就可以看出，AB的交叉熵就是A和B的KL散度減去A的熵；

而且對於這兩個KL散度和交叉熵來說，如果

S(A)是一個常量，則KL散度和交叉熵時相同的；

對於我們資料標籤和訓練得到的預測標籤來說，初始情況下肯定分佈是不同的。我們的目的就是使得預測值和真實值越來越相近，歸根到底也就是希望兩者的KL散度足夠小，也就是：

所以我們可以使用這個來評估模型；

那麼我們為什麼要用交叉熵而不用KL散度呢，其實我們通過公式就可以看出原因。由於初始值固定，也就是A固定，測試A的熵就是固定的，所以我們求A和B的交叉熵就可以；換句話來說，最小化KL散度，其實就是在最小化交叉熵；

熵、交叉熵及似然函式的關係
2019-07-31
熵函式
熵，交叉熵，Focalloss
2024-07-24
熵
熵、資訊量、資訊熵、交叉熵-個人小結
2019-03-01
熵
關於GAN的個人理解
2019-02-11
關於ConcurrentHashMap1.8的個人理解
2019-01-19
HashMap
關於排列熵的一些理解與解釋
2020-12-05
熵
交叉熵損失CrossEntropyLoss
2023-02-20
熵ROS
資訊熵，交叉熵與KL散度
2021-06-29
熵
交叉熵、KL 散度 | 定義與相互關係
2024-07-25
熵
關於01揹包個人的一些理解
2022-07-06
Tensorflow-交叉熵&過擬合
2021-01-28
熵
【機器學習基礎】熵、KL散度、交叉熵
2018-09-27
機器學習熵
個人對於vue的理解
2018-08-11
Vue
關於 Python 裝飾器的一些個人理解
2021-03-05
Python
談談交叉熵損失函式
2019-04-12
熵函式
熵、聯和熵與條件熵、交叉熵與相對熵是什麼呢？詳細解讀這裡有！
2020-07-29
熵
關於SVM數學細節邏輯的個人理解（一）
2018-04-11
關於藝工交叉的體驗
2019-01-10
關於Gdb工具的交叉編譯、移植
2020-11-14
編譯
圖示Softmax及交叉熵損失函式
2018-09-14
熵函式
個人對於flux、redux及vuex的理解
2018-08-15
ReduxVue
GOT & PLT 易於理解的個人筆記
2024-08-11
Go筆記
重新理解熵編碼
2024-06-26
熵
pytorch使用交叉熵訓練模型學習筆記
2024-06-17
PyTorch熵模型筆記
資訊理論之從熵、驚奇到交叉熵、KL散度和互資訊
2023-04-15
熵
ML-邏輯迴歸-Softmax-交叉熵（小航）
2019-02-27
邏輯迴歸熵
關於 DOM 的理解
2019-04-10
關於Vuex的理解
2019-05-08
Vue
關於servlet的理解
2019-04-22
Servlet
關於-this指向的理解
2021-01-19
dubbo個人理解於應用章（二）
2019-01-19
個人對於JavaScript中Number.toFixed()方法的理解
2018-10-26
JavaScript
@Cacheable關於快取的個人筆記
2020-11-05
快取筆記
關於協程的理解
2020-10-22
關於對Host的理解
2018-03-28
關於BFC理解
2019-02-27
理解「交叉驗證」(Cross Validation)
2019-04-27
ROS
關於面試的一些個人看法
2018-10-15
面試

關於交叉熵的個人理解

相關文章