位元組序探析：大端與小端的比較

阮一峰發表於2022-06-03

原文網址 : http://www.ruanyifeng.com/blog/2022/06/endianness-analysis.html

今天談談一個重要的計算機概念，大家可能都聽說過它，但是很少深究，那就是位元組序（Endianness）。

一、概念

位元組序指的是，多位元組資料的記憶體排列順序。這樣說比較抽象，使用圖形解釋就很好懂。

記憶體好比一排房間，每個位元組是一間房。每間房都有門牌號（記憶體地址），從0號開始，然後是1號、2號......

0號位元組的地址小，稱為低位記憶體；3號位元組的地址大，稱為高位記憶體。

現在有一個數值abcd要放進這些房間，每個房間放一個數字，那麼有兩種放法。

第一種放法是，第一位a放在低位地址（0號），最後一位d放在高位地址（3號）。

這種排列稱為"大端序"（big-endian，簡稱 BE），即大頭在前，因為a是abcd的大頭（最重要的數字）。

第二種放法是，第一位a放在高位地址（3號地址），最後一位d放在低位地址（0號地址）。

這種排列稱為"小端序"（little-endian，簡稱 LE），即小頭d在前。

大端序和小端序合稱位元組序，這兩個名字來自18世紀的英國小說《格列佛遊記》。某國分成兩派，一派認為雞蛋應該從大頭吃起，稱為"大端派"；另一派認為，雞蛋應該從小頭吃起，稱為"小端派"。兩派相執不下，誰也無法說服誰，最後甚至為此交戰。

二、可讀性

對於人類來說，不同位元組序的可讀性是不一樣的。大部分國家的閱讀習慣是從左到右閱讀。

大端序的最高位在左邊，最低位在右邊，符合閱讀習慣。所以，對於這些國家的人來說，從左到右的大端序的可讀性更好。

但是現實中，從右到左的小端序雖然可讀性差，但應用更廣泛，x86 和 ARM 這兩種 CPU 架構都採用小端序，這是為什麼？

或者換一種問法，兩種不同的位元組序為什麼會並存，統一規定只使用一種，難道不是更方便嗎？

原因是它們有各自的適用場景，某些場景大端序有優勢，另一些場景小端序有優勢，下面就逐一分析。

三、檢查奇偶性

小端序優勢最明顯的，大概就是檢查奇偶性，即透過檢視個位數，確定某個數字是奇數還是偶數。

以123456為例，大端序從左到右排列，計算機必須一直讀到最後一位的個位數6，才能確定這是偶數。

小端序是從右到左排列，個位數在第一位。所以，只要讀取第一位，就能確定它是偶數。

四、檢查正負號

一個類似的場景是檢查正負號，確定一個數是正數還是負數。

大端序的符號位在左邊第一位，小端序的符號位在右邊最後一位。所以，大端序有優勢，只看第一位就能知道是不是負數。

五、比較大小

下一個操作是比較大小。現在有三個數字，需要比較大小：43662576，594，2。

上圖是大端序排列，因為是從左到右排列，所以三個數字在右邊個位數對齊。比較大小時，計算機就不得不讀取每一個數的所有位，直到個位數，再進行比較。

如果改成小端序，就是下面的排列方式。

小端序是從右到左，所以三個數字在第一位對齊。計算機就不需要讀取所有位，哪個數字先讀不到下一位，就是最小的。比如，2這個數字就沒有第二位，所以讀到第二位時，就知道它是最小的。

所以，比較大小時，小端序有優勢。

六、乘法

接下來，再看乘法操作。

乘法是逐位相乘，每一輪乘法都要向前進位。

上圖是大端序的24165乘以3841。大端序的乘法是向左進位，也就是向左邊擴充套件，必須等到每一輪的結果都出來（上例是四輪），再相加統一寫入記憶體。

如果改成小端序的乘法，就不需要等待下一輪的結果，每一輪都可以直接寫入記憶體。

上圖是小端序的24165乘以3841。小端序的乘法是向右進位，也就是向右邊擴充套件，左邊的邊界不變。每一輪結果寫入記憶體後，就不需要移動，後面有變化只需要改動對應的位就行了。

因此，小端序的乘法有明顯優勢。

七、任意精度整數

上一個例子的從低位開始計算的特性，對於任意精度整數特別有用。任意精度整數又稱大整數，可以存放任意大小的整數。

它的內部實現是把整數分成一個個較小的單位，通常是 uint32（無符號32位整數）或 uint64（無符號64位整數），按順序組合在一起。

如果是大端序，第一個 u64 就是這個整數最大的部分。運算時，一旦這個數發生變化，需要進位，後面的所有位都必須移動和改寫。小端序發生進位時，往往就不需要所有位移動。

小端序的另一個好處是，如果逐位元組的運算從個位數開始（比如乘法和加法），可以從左到右依次運算一個個 u64，算完上一個再讀取下一個。大端序就不行，必須讀取整個數以後再進行運算。

八、更改型別

最後一個例子是，C 語言有一種 cast 操作，可以強制改變變數的資料型別，比如把32位整數強行改變為16位整數。

上圖中，32位整數0x00000001更改為16位整數0x0001，大端序是截去前面兩個位元組，這時指向這個地址的指標必須向後移動兩個位元組。

小端序就沒有這個問題，截去的是後面兩個位元組，第一位的地址是不變的，所以指標不需要移動。

九、總結

綜上所述，大端序和小端序各自的優勢如下。

如果需要逐位運算，或者需要到從個位數開始運算，都是小端序佔優勢。反之，如果運算只涉及到高位，或者資料的可讀性比較重要，則是大端序佔優勢。

十、參考連結

On Endianness, Karl Stenerud

（完）

大端序、小端序、網路位元組序
2020-12-08
C# 中大端序與小端序
2020-11-17
C#
大端序和小端序
2019-05-10
golang之大端序、小端序
2019-01-24
Golang
Dalvik 和 Java 位元組碼的比較
2021-09-26
Java
Qt 大小端位元組序的處理
2024-03-13
QT
大端小端講解
2020-12-17
大端和小端的問題
2019-04-03
Java的位元組碼和ABAP load的比較
2020-08-24
Java
C++與Qt的位元組序探究：
2020-09-26
C++QT
CRC 自動判斷大端小端
2018-07-02
modbus和位元組序
2024-04-25
Java位元組流檔案複製及效率比較
2018-08-03
Java
C/C++ 判斷計算機儲存器位元組序（端序）的幾種方式
2024-10-03
C++計算機
計算機系統中的大端模式和小端模式
2023-05-06
計算機模式
團隊如何組織？前後端團隊與業務功能團隊的比較
2022-06-27
後端
模組化與微服務比較 MircoService VS OSGI
2019-03-22
微服務
Redis的Java客戶端比較：絕地武士與生菜
2022-05-31
RedisJava客戶端
volatile與Atomic的比較
2020-11-12
【Linux網路程式設計】位元組序
2024-08-28
Linux程式設計
==與equals比較
2021-05-25
Android與物聯網裝置通訊-自定義報文與位元組序
2018-06-18
Android
MVVM與MVC模式的比較
2018-09-03
MVVMMVC模式
PostgreSQL與MySQL的比較 - hackr
2020-05-24
MySql
XTask與RxJava的使用比較
2022-04-10
RxJava
Flutter與React Native的比較
2021-05-01
FlutterReact Native
深入理解Emoji(二) —— 位元組序和BOM
2018-11-30
utf-8 不用考慮位元組序（轉）
2018-04-26
Java HTTP 客戶端的比較 - reflectoring
2021-11-16
JavaHTTP客戶端
Go 與 C++ 的對比和比較
2021-07-12
GoC++
第七節無窮小的比較
2024-04-19
Python小知識之物件的比較
2021-10-12
Python物件
Hibernate與mybatis比較
2018-12-21
MyBatis
yarn 與 npm 比較
2018-12-02
YarnNPM
Vue與React比較
2018-09-06
VueReact
Vuex與Redux比較
2024-11-15
VueRedux
RecyclerView與ListView比較
2018-03-26
View
HTTP方法之@RequestMapping與Spring組合註解比較 - Rahul
2021-12-03
HTTPAPPSpring