演算法科普：有趣的霍夫曼編碼

程式設計師吳師兄發表於2019-02-17

原文網址 : https://juejin.im/post/5c68b68a51882562e747fbea

演算法科普：有趣的霍夫曼編碼

前言

霍夫曼編碼 ( Huffman coding ) 是一種可變長的字首碼。霍夫曼編碼使用的演算法是 David A. Huffman 還是在MIT 的學生時提出的，並且在 1952 年發表了名為《 A Method for the Construction of Minimum-Redundancy Codes 》的文章。

編碼這種編碼的過程叫做霍夫曼編碼，它是一種普遍的熵編碼技術，包括用於無損資料壓縮領域。

霍夫曼編碼過程

霍夫曼編碼使用一種特別的方法為訊號源中的每個符號設定二進位制碼。出現頻率更大的符號將獲得更短的位元，出現頻率更小的符號將被分配更長的位元，以此來提高資料壓縮率，提高傳輸效率。

以字串 ” ABAABACD “ 為例進行說明。

接下來，按照字元出現的比例從高往低對字元進行排序。

圖 1

然後，按出現比例低的順序查詢兩個字母。在這種情況下，它是 “ C ” 12.5% 和 “ D ” 12.5% 。

通過一條線連線兩個字母拼構成一個樹狀結果。將兩個字母合併為 “ C 或 D”，並將出現比率相加起來。

動畫 2

按照同樣的操作，將合併後的 “ C 或 D ” 視為一個字元，重複相同的操作。

在 “ A " "B" " C 或 D " 三個中，按照出現比例低的順序查詢兩個字母。

圖 3

圖 4

這樣，所有的字母都變成了" A 或 B 或 C 或 D" ，出現的比率為 100% 。

圖 4 就是霍夫曼編碼的樹結構。

接下來再次顯示各個字母出現的比率，同時使用 0 和 1 進行編碼，程式碼 0 和 1 分別分配給上下延伸的分支。

圖 5

分配完畢後，從樹的根部遍歷每個字元並確定相應的程式碼。

在 ” A “ 的情況下，被分配的程式碼為 ” 0 “
在 ” B “ 的情況下，被分配的程式碼為 ” 10 “
在 ” C “ 的情況下，被分配的程式碼為 ” 110 “
在 ” D “ 的情況下，被分配的程式碼為 ” 111 “

動畫 6

就這樣，通過這樣的編碼規則， ” ABAABACD “ 的二進位制編碼就變成了 ” 01000100110111 “，只需要 14 個位元就能表示，比單純的使用 2 位元表示一個字元縮短了很多。

演算法科普：有趣的霍夫曼編碼

相關文章

有趣的科普書
2020-04-07
字串編碼入門科普
2019-03-04
字串編碼
有趣的演算法
2024-04-10
演算法
XSS與字元編碼的那些事兒 ---科普文
2020-08-19
字元
Visual Studio 2022有趣又強大的智慧輔助編碼
2021-12-24
有趣的程式碼攻防戰
2018-08-29
有趣的程式碼註釋
2019-05-27
3.3　編碼/解碼演算法
2018-08-25
演算法
資料結構之「霍夫曼樹」
2019-04-14
資料結構
霍夫曼樹（最優二叉樹）的實現
2020-10-20
二叉樹
一些有趣的VBS指令碼
2023-03-07
指令碼
那些有趣的演算法之布隆過濾器
2019-02-26
演算法過濾器
RS編碼和糾錯演算法
2020-12-02
演算法
一篇有趣的負載均衡演算法實現
2020-06-01
負載演算法
演算法社會：“碼農”翻身為“編碼精英”帶來的思考？
2022-02-15
演算法
貪心演算法——Huffman 壓縮編碼的實現
2018-12-17
演算法
有趣的css
2018-04-17
CSS
小科普：機器學習中的粒子群優化演算法！
2018-07-24
機器學習優化演算法
密碼學基礎：編碼方式、訊息摘要演算法、加密演算法總結
2021-12-02
密碼學演算法加密
【有趣】這段java程式碼太古怪
2019-04-01
Java
帶你深入 Dart 解析一個有趣的引用和編譯實驗
2021-05-28
Dart編譯
AI 演算法在視訊可分級編碼中的應用
2021-11-01
AI演算法
Mac有趣圖片編輯軟體——Pimp My Picture for Mac
2020-05-22
Mac
教你用Java位元組碼做點有趣的事
2018-07-20
Java
Python程式設計：探索有趣的程式碼設計模式
2024-09-08
Python程式設計設計模式
區塊鏈100講：16進位制資料的編碼/解碼演算法
2018-05-24
區塊鏈演算法
聊一聊那些腦洞大開、有趣又奇葩的排序演算法
2019-05-10
排序演算法
MMKV的編碼和解碼
2019-03-16
《演算法圖解》讀書筆記—像小說一樣有趣的演算法入門書
2019-05-02
演算法圖解筆記
有趣
2024-12-09
幾個有趣的線上python 程式碼學習網站
2018-10-08
Python學習網站
演算法面試：陣列編碼面試問題
2019-01-23
演算法面試陣列
異或加密之美 #主流web弱演算法科普文
2020-08-19
加密Web演算法
Python有趣的小案例
2018-06-12
Python
反向代理的有趣用法
2020-08-19
有趣的html頁面
2024-10-27
HTML
OpenLR 的編碼與解碼
2024-03-14
python中的編碼&解碼
2024-08-31
Python