重新理解熵編碼

winkom發表於2024-06-26

原文網址 : https://www.cnblogs.com/consistency/p/18270117

熵

重新理解熵編碼

僅作為個人筆記，描述不嚴謹，已經系統學習《資訊理論》，用於回顧以及記錄一些以前忽略的看法。

熵的理解

\(I(x_{i})\)通常稱為信源符號\(x_{i}\)的自資訊，也可以理解為單個符號\(x_{i}\)的符號熵，都是表示出現該符號的不確定性。自資訊\(I(x_{i})\)定義為：

\[I(x_{i})=log_{2}\,{\frac{1}{P(x_{i})}} \]

所有符號的符號熵求平均即為平均符號熵，也是信源的資訊熵。資訊熵\(H(X)\)從平均意義上度量的是總體的資訊：

\[H(X)=E[log_{2}\,\frac{1}{P(x_{i})}]=-\sum_{i=1}^{q}P(x_{i})log_{2}\,P(x_{i}) \]

編碼理解

熵與編碼碼長

熵是服從某一特定機率分佈事件的理論最小平均編碼長度

對於具有\(N\)種等可能性狀態的資訊，每種狀態的可能性等概\(P = \frac{1}{N}\)，則編碼每種狀態所需的最小編碼長度公式與自資訊類似：

\[l o g_{2}\:N=-l o g_{2}\:\frac{1}{N}=-l o g_{2}\:P \]

因此，對於整個非等概信源來說，其平均碼長計算公式與計算資訊熵類似：

\[Entropy=-\sum_{i}P(i)l o g_{2}\,P(i) = \mathbb{E}_{x\sim P}[-l o g_{2}\,P(x)] \]

可以理解為如果熵比較大，意味著這一資訊有較多的可能狀態，相應的每個狀態的可能性比較低，即平均編碼長度較長；因此每當來了一個新的資訊，我們很難對其作出準確預測，即有著比較大的混亂程度/不確定性/不可預測性。

交叉熵

當我們不知道事件的機率分佈，又想計算熵，就需要對熵做一個估計，熵的估計的過程自然而然的引出了交叉熵。在觀測之前，我們只有預估的機率分佈\(Q\)，使用估計得到的機率分佈，可以計算估計的熵：

\[H(Q)=\mathbb{E}_{x\sim Q}[-l o g_{2}\;Q(x)] \]

當我們已知隨機變數的取值範圍時，就可以得到交叉熵：

\[C r o s s E n t r o p y=H(P||Q)=\mathbb{E}_{x\sim P}[-l o g_{2}\;Q(x)]=H(P) +D(P||Q) \]

\(D(P||Q)\)為P和Q之間的\(Kullback-Leibler\, divergence\)，即\(KL\)散度。為了減小平均編碼長度，一般情況下讓交叉熵儘量小，當 \(𝐻(𝑃)=𝐶𝑟𝑜𝑠𝑠𝐸𝑛𝑡𝑟𝑜𝑝𝑦\) 時，交叉熵最小。可以得出，在編碼問題中，交叉熵是位元速率的自然度量。

熵編碼(四)-算術編碼(二)
2024-08-03
熵
關於交叉熵的個人理解
2019-02-18
熵
近似熵-樣本熵-多尺度熵
2020-08-23
熵
熵，交叉熵，Focalloss
2024-07-24
熵
重新理解雲原生
2022-11-22
重新理解架構
2022-11-22
架構
資訊熵（夏農熵）
2020-10-11
熵
softmax迴歸——原理、one-hot編碼、結構和運算、交叉熵損失
2021-08-21
熵
關於排列熵的一些理解與解釋
2020-12-05
熵
熵、資訊量、資訊熵、交叉熵-個人小結
2019-03-01
熵
資訊熵概念隨筆——資訊熵、資訊的熵
2018-07-24
熵
熵、聯和熵與條件熵、交叉熵與相對熵是什麼呢？詳細解讀這裡有！
2020-07-29
熵
換個角度，重新理解架構
2022-07-29
架構
ML-熵、條件熵、資訊增益
2019-03-29
熵
資訊熵，交叉熵與KL散度
2021-06-29
熵
SOLIDWORKS編碼重新命名批次完成原來這麼簡單
2023-12-17
Solid
最大熵模型
2018-03-06
熵模型
熵增定律
2024-07-09
熵
重新理解 Go 培訓和 Go 人才
2021-04-15
Go
重新編譯python(親證有效)
2024-03-13
編譯Python
評價模型TOPSIS與熵權法MATLAB程式碼
2024-10-09
模型熵Matlab
seq2seq通俗理解----編碼器和解碼器(TensorFlow實現)
2019-08-30
熵、交叉熵及似然函式的關係
2019-07-31
熵函式
深入理解中文編碼：原理、應用與實踐
2024-04-12
關於加密，解密，摘要，編碼的理解和應用
2024-06-13
加密解密
【機器學習基礎】熵、KL散度、交叉熵
2018-09-27
機器學習熵
重新理解RocketMQ Commit Log儲存協議
2024-10-23
MQMIT協議
XML學習筆記（一）：關於字元編碼的理解
2019-01-12
XML筆記字元
深入理解Emoji(一) —— 字符集，字符集編碼
2018-11-30
Consul的反熵
2019-08-14
熵
以一般人邏輯理解數值的編碼：原碼，補碼，真值
2020-11-13
迴歸架構本質，重新理解微服務
2019-08-20
架構微服務
要點提煉| 理解JVM之程式編譯&程式碼優化
2019-01-02
JVM編譯優化
熵權（值）法計算權重原理解釋&綜合得分縱向對比
2024-04-29
熵
CentOS 下重新編譯 nginx 新增模組
2020-03-20
CentOS編譯Nginx
2024熵密杯wp
2024-10-07
熵
交叉熵損失CrossEntropyLoss
2023-02-20
熵ROS
對預編譯的理解
2020-11-21
編譯

重新理解熵編碼

重新理解熵編碼

熵的理解

編碼理解

熵與編碼碼長

交叉熵

相關文章