介紹
base64
其實是一種編碼轉換方式, 將ASCII
字元轉換成普通文字, 是網路上最常見的用於傳輸8Bit位元組程式碼的編碼方式之一。
base64
由字母a-z
、A-Z
、0-9
以及+
和/
, 再加上作為墊字的=
, 一共65字元組成一個基本字符集, 其他所有字元都可以根據一定規則, 轉換成該字符集中的字元。
abcde
=>YWJjZGU=
ABCDE
=>QUJDREU=
在日常開發中, 最常見的便是將blob
和base64
之間相互轉換.
// blob to base64
function blobTobase64(blob) {
const fileReader = new FileReader()
let base64 = ''
fileReader.onload = () => {
base64 = fileReader.result // 讀取base64
}
fileReader.readAsDataURL(blob) // 讀取blob
}
// base64 to blob
function dataURItoBlob(dataURI) {
var mimeString = dataURI
.split(',')[0]
.split(':')[1]
.split(';')[0] // mime型別
var byteString = atob(dataURI.split(',')[1]) //base64 解碼
var arrayBuffer = new ArrayBuffer(byteString.length) //建立ArrayBuffer
var intArray = new Uint8Array(arrayBuffer) //建立檢視
for (var i = 0; i < byteString.length; i++) {
intArray[i] = byteString.charCodeAt(i)
}
return new Blob([intArray], { type: mimeString }) // 轉成 blob
}
複製程式碼
編碼和解碼
瀏覽器
最新的瀏覽器自帶了兩個方法用於base64
的編碼和解碼
分別是atob
和btoa
- atob:將
base64
轉成8bit
位元組碼 - btoa:將
8bit
位元組碼轉成base64
對於舊版瀏覽器, 可以使用js-base64
Node
目前node
中還不支援使用atob
和btoa
,但是可以通過Buffer
來實現, 參考文件
if (typeof btoa === 'undefined') {
global.btoa = function (str) {
return Buffer.from(str).toString('base64');
};
}
if (typeof atob === 'undefined') {
global.atob = function (b64Encoded) {
return Buffer.frome(b64Encoded, 'base64').toString();
};
}
複製程式碼
轉換方式
base64編碼方式對於中文是不適用的, 因為中文對應多個位元組, 因此可以先使用
encodeURIComponent
編碼後再進行base64
編碼.
編碼
-
每三個位元組作為一組,每個位元組8bit, 一共是24個二進位制位。
'ABCD' ["ABC", "D"] // 每三位元組做一組 ['01000001010000100100001', '01000100'] // 轉成8bit 複製程式碼
-
將每組的24個二進位制位再細分為四組,每組有6個二進位制位, 此時為二維陣列。
[['010000', '010100', '001001', '000011'], ['010001', '00']] 複製程式碼
- 二個位元組的情況:將這二個位元組的一共16個二進位制位, 按照上面的規則, 轉成三組, 那麼最後一項只有4位,則在後面加兩個0, 補夠6位, 並在第三步對應位置加上墊字元
=
。 - 一個位元組的情況:將這一個位元組的8個二進位制位,按照上面的規則轉成二組, 那麼最後一項只有2位, 則在後面加上四個0, 並在第三步對應位置加上兩個墊字元
=
。 - 簡單說就是, 缺多少位就在後面補多少個0, 直到滿6位。
[['010000', '010100', '001001', '000011'], ['010001', '000000']] 複製程式碼
- 二個位元組的情況:將這二個位元組的一共16個二進位制位, 按照上面的規則, 轉成三組, 那麼最後一項只有4位,則在後面加兩個0, 補夠6位, 並在第三步對應位置加上墊字元
-
在每組前面加兩個00,擴充套件成32個二進位制位,即四個位元組。
規則是這麼說, 但這一步我覺得可以忽略, 因為
00101010
和101010
是一樣的
-
將每組對應的二進位制轉成十進位制, 在
base64char
字符集中找到對應的字元。[["Q", "U", "J", "D"], ["R", "A"]] 複製程式碼
-
每一組都最終都應該轉成四個字元
-
如果不足四個字元, 說明明文中並不足3位元組, 因此需要補上墊字元
=
, 補夠四個字元
[["Q", "U", "J", "D"], ["R", "A", "=", "="]] 複製程式碼
-
-
將最後的結果連線成字串, 則為最終編碼結果。
'ABCD' > 'QUJDRA=='
根據編碼方式來看, 每3個位元組將會被編碼成四個字元, 如果不足3個位元組, 則補上墊字元=
, 缺幾個就補幾個。
btoa('A') // "QQ=="
btoa('AB') // "QUI="
btoa('ABC') // "QUJD"
btoa('ABCD') // "QUJDRA=="
複製程式碼
解碼
解碼步驟就是跟編碼步驟反過來
- 每四個位元組分為一組。
- 將每組的中除了墊字元
=
外的字元, 在base64char
字符集中找到所在下標。 - 將十進位制下標轉成二進位制, 如果不夠6位(一定不會超過6位), 則在前面補
0
。- 如果遇到墊字元
=
, 說明其明文不足3位元組, 則根據墊字元=
的數量, 在該組最後一項中去掉對應個數的0
- 一個墊字元, 則去掉兩個
0
- 兩個墊字元, 則去掉四個
0
- 如果遇到墊字元
- 將每組中的二進位制字串連線,此時字串長度一定是8的倍數,然後每8位分割成一個位元組。
- 通過
String.fromCharCode
將二進位制轉成字元, 然後拼接 - 將各個字元連線, 為最終解碼結果。
題外-進位制轉換
- parseInt(str, radix): 根據radix可以將字串轉成十進位制
- initValue.toString(radix): 將initValue轉成其他進位制
// n進位制轉十進位制
parseInt('1000', 2) // 8
parseInt('1000', 16) // 4096
// 進位制間轉換
(10).toString(2) // "1010", 10進位制轉2進位制
(0xff).toString(2) // "11111111", 16進位制轉2進位制
複製程式碼