計算機中位(bit), 位元組(byte), 字(word)的關係

安全劍客發表於2020-02-22
計算機中位(bit), 位元組(byte), 字(word)的關係,先從定義出發。
中位(bit), 位元組(byte), 字(word)定義
1、位(bit)

來自英文bit,音譯為“位元”,表示二進位制位。位是計算機內部資料儲存的最小單位,11010100是一個8位二進位制數。一個二進位制位只可以表示0和1兩種狀態(21);兩個二進位制位可以表示00、01、10、11四種(22)狀態;三位二進位制數可表示八種狀態(23)……。

2、位元組(byte)

位元組來自英文Byte,音譯為“拜特”,習慣上用大寫的“B”表示。 位元組是計算機中資料處理的基本單位。計算機中以位元組為單位儲存和解釋資訊,規定一個位元組由八個二進位制位構成,即1個位元組等於8個位元(1Byte=8bit)。八位二進位制數最小為00000000,最大為11111111;通常1個位元組可以存入一個ASCII碼,2個位元組可以存放一個漢字國標碼。

3、字

計算機進行資料處理時,一次存取、加工和傳送的資料長度稱為字(word)。一個字通常由一個或多個(一般是位元組的整數位)位元組構成。例如286微機的字由2個位元組組成,它的字長為16;486微機的字由4個位元組組成,它的字長為32位機。 計算機的字長決定了其CPU一次操作處理實際位數的多少,由此可見計算機的字長越大,其效能越優越。

一個ascll碼就是一個位元組, 因為ascll碼的二進位制範圍是00000000到11111111, 十進位制範圍是0到255,

計算機中位(bit), 位元組(byte), 字(word)的關係計算機中位(bit), 位元組(byte), 字(word)的關係

unicode指的是UCS-2的編碼方式, 是以兩個位元組的長度

utf-8是一種變長的編碼方式,它可以使用1~4個位元組表示一個符號,根據不同的符號而變化位元組長度

utf-16是,好處在於大部分字元都以固定長度的位元組 (2位元組) 儲存,但UTF-16卻無法相容於ASCLL編碼

UTF-32(或 UCS-4)是以4個位元組的長度固定儲存的;

每一個位元組檔案都是以約定的編碼進行儲存的。

中位(bit), 位元組(byte), 字(word)的關係
1. bit:位

一個二進位制資料0或1,是1bit;

2. byte:位元組

儲存空間的基本計量單位,如:MySQL中定義 VARCHAR(45)  即是指 45個位元組;
1 byte = 8 bit

3. 一個英文字元佔一個位元組(視編碼而定)

1 字母 = 1 byte = 8 bit

4. 一個漢字佔2個位元組(視編碼而定)

1 漢字 = 2 byte = 16 bit

原文地址:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559985/viewspace-2676732/,如需轉載,請註明出處,否則將追究法律責任。

相關文章