前端進階：二進位制資料的操控—-附專案程式碼

單通發表於2019-02-16

原文網址 : https://flycode.co/archives/90341

前端

引言： 近期，工作中發現，有些前端小夥伴很少接觸到二進位制資料，所以將專案中二進位制資料的應用和大家分享一下，適合入門瞭解，高手慎入，歡迎拍磚。

專案背景： 基於公司原有圖形處理的二進位制資料檔案（公司自定義的二進位制資料格式），實現Canvas繪圖。

話說：專案開始的時候我也是一臉懵逼，這麼多技術難點需要攻克，1. 如何請求二進位制資料流？2. 如何解壓二進位制資料？3. 如何讀取二進位制資料？……

接下來我們一一攻破：見招拆招

1. 資料請求`arraybuffer`：

基於ajax請求，設定接受的資料格式為arraybuffer型別，基於流檔案的讀取是需要非同步來處理的，否則資料可能有丟失。

  let oReq = null;
  if (window.XMLHttpRequest) {
    oReq = new XMLHttpRequest();
  }
  else {
    oReq = new ActiveXObject(`Microsoft.XMLHTTP`);
  }

  oReq.onprogress = this.updateProgress;//下載進度；
  oReq.responseType = "arraybuffer";
  oReq.onload = function () {
  // 資料下載完成會觸發；
    if ((oReq.status >= 200 && oReq.status < 300) || oReq.status == 304) {
      var arrayBuffer = oReq.response;
      // 接下來的任務
      ReadFromByteArray(arrayBuffer); //讀取收到的資料
    }
    if (oReq.status === 404) {
      alert("找不到對應檔案！")
    }
  };

  oReq.open("GET", reqUrl, true);
  oReq.send(null);
複製程式碼

2. 資料讀取`ArrayBuffer`和`DataView`：

ArrayBuffer 物件用來表示通用的、固定長度的原始二進位制資料緩衝區。ArrayBuffer 不能直接操作，而是要通過型別陣列物件或 DataView 物件來操作，它們會將緩衝區中的資料表示為特定的格式，並通過這些格式來讀寫緩衝區的內容。

2.1 校驗資料的大小

function ReadFromByteArray(buffer){
  parseInt(buffer.byteLength / 1024);//檔案大小，單位KB;
  
  if (buffer.byteLength < 64) {
     // 失敗
     console.log("檔案格式不對：長度小於64");
     return false;
     } else {
     // 成功 解壓資料
   }
}
複製程式碼

DataView 檢視是一個可以從 ArrayBuffer 物件中讀寫多種數值型別的底層介面，在讀寫時不用考慮平臺位元組序問題。

接下來我們可以建立一個DataView 物件例項，此方法適合順序儲存的資料讀取，非順序（如增量式儲存的資料不能按順序讀取，需要安裝table中索引讀取，否則會讀錯）。js提供了基本的二進位制讀取API，為了不用手動計算偏移量，我們可以對基礎API進行封裝，

DataView常用讀取資料的API

getFloat32()
getFloat64()
getInt16()
getInt32()
getInt8()
getUint16()
getUint32()
getUint8()
複製程式碼

2.2 校驗檔名稱

let dataView = new DataView(buffer, 0); //將上面獲取的buffer傳入到檢視中
let headstr = headerFiler.ReadUTFBytes(5);//讀取5個UTF8位元組，結果為檔案格式

if (headstr != "DWG") { 
//DWG為檔案的格式，存放在資料結構的頭部
 return false;
}else{
// 繼續讀取資料

}
       
複製程式碼

3. 資料解壓`TypedArray`和`pako.js`：

一個TypedArray 物件描述一個底層的二進位制資料快取區的一個類似陣列(array-like)檢視。事實上，沒有名為 TypedArray的全域性物件，也沒有一個名為的 TypedArray建構函式。相反，有許多不同的全域性物件，下面會列出這些針對特定元素型別的型別化陣列的建構函式。在下面的頁面中，你會找到一些不管什麼型別都公用的屬性和方法。

為了減少資料的傳入，後端會對二進位制資料進行壓縮，前端難道要手寫解壓程式碼？就算你敢寫，你是否敢用？當然尋找三方外掛，關於js二進位制資料的解壓外掛還真不多，我選用了pako.js,移動端暫為發現嚴重相容性問題，PC端（IE）存在，一定慎用。期待推薦更加三方。

3.1 建立`TypedArray`

先將buffer轉換為型別陣列TypedArray，以便讀取和操控。

let compressdata = new Uint8Array(buffer, byteOffset, length);//把上面獲取`buffer`轉換成可操控的`TypedArray`。建立一個無符號整型的TypedArray，偏移量為byteOffset，長度為length。
複製程式碼

Tips：偏移量為byteOffset類似於陣列的索引,預設為0, 設定後，從此開始讀取。如：

const compressdata = new Uint8Array(buffer, 4, 10);//從第4個位元組開始讀取，長度為10個位元組
複製程式碼

3.2 解壓資料

利用pako.js解壓資料

let uncompress = pako.inflate(compressdata);//解壓資料；
let uncompressdata = uncompress.buffer;// ArrayBuffer {}
let dataViewData = new DataView(uncompressdata, 0);//解壓後資料；
複製程式碼

Tips：js中的number資料型別，無論數字的大小，都將佔用8個位元組，即64位，就是Java 中double型別的長度；1字串會佔用2位元組，即16位。
js中此種規定，省去了我們宣告變數時對資料大小的計算，方便使用，但是，這樣就會造成浪費大量的儲存空間，明顯增大資料的大小。及其不便於大資料的傳輸，所以會對資料進行壓縮。

封裝資料讀取的API，避免手動計算偏移量

function WsFiler(dataView) {
    this.dataView = dataView;
    this.dataView.position = 0;
}

WsFiler.SEEK_BEGIN = 0;
WsFiler.SEEK_SET = 0;
WsFiler.SEEK_CUR = 1;
WsFiler.SEEK_END = 2;

WsFiler.prototype.ReadByte = function () {
    var b = this.dataView.getUint8(this.dataView.position);
    this.dataView.position++;
    return b;
}

WsFiler.prototype.ReadShort = function () {
    var s = this.dataView.getInt16(this.dataView.position, true);
    this.dataView.position += 2;
    return s;
};

WsFiler.prototype.ReadInt32 = function () {
    var int32 = this.dataView.getInt32(this.dataView.position, true);
    this.dataView.position += 4;
    return int32;
};

WsFiler.prototype.ReadUInt32 = function () {
    var uint32 = this.dataView.getUint32(this.dataView.position, true);
    this.dataView.position += 4;
    return uint32;
}
WsFiler.prototype.ReadUtf8String = function () {
    var len = this.ReadInt32();//字串長度；

    return this.ReadUTFBytes(len);
};

WsFiler.prototype.ReadFloat = function () {
    var ret = this.dataView.getFloat32(this.dataView.position, true);
    this.dataView.position += 4;
    return ret;
};

WsFiler.prototype.ReadDouble = function () {
    var ret = this.dataView.getFloat64(this.dataView.position, true);
    this.dataView.position += 8;
    return ret;
}
複製程式碼

4. 資料儲存：

讀取到的資料可以任意操控，可以建立一個陣列進行儲存。便於我們的後續操控。資料的儲存就相對簡單了，根據需要將資料拆分即可。

這樣，我們就完成了二進位制資料的請求、解壓、讀取和儲存了。

後續繼續分享，用canvas把我們讀到的資料畫到網頁上。

歡迎大家拍磚。不勝感謝！

參考文獻：MDN

https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/ArrayBuffer
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/DataView
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/TypedArray

前端進階：二進位制資料的操控----附專案程式碼
2018-04-22
前端
複雜二進位制資料
2024-04-27
二進位制，八進位制，十進位制，十六進位制的相互轉換
2020-02-01
進位制詳解：二進位制、八進位制和十六進位制
2021-07-07
java中二進位制、八進位制、十進位制、十六進位制的轉換
2018-10-12
Java
二進位制，八進位制，十進位制，十六進位制之間的轉換
2018-07-09
JavaScript 二進位制、八進位制與十六進位制
2019-12-20
JavaScript
二進位制與二進位制運算
2021-11-27
JavaScript 讀寫二進位制資料
2018-09-08
JavaScript
利用vstruct解析二進位制資料
2020-08-19
Struct
【進位制轉換】二進位制、十六進位制、十進位制、八進位制對應關係
2024-08-05
二進位制反碼求和
2018-05-13
十進位制——二 (八、十六 )進位制
2020-10-11
ASCII碼是幾位二進位制碼？
2018-11-09
ASCII
JAVA 二進位制，八進位制，十六進位制，十進位制間進行相互轉換
2018-11-12
Java
計算機基礎進位制轉換（二進位制、八進位制、十進位制、十六進位制）
2018-09-07
計算機
二進位制、十進位制與十六進位制相互轉化
2024-03-28
二進位制
2024-06-07
（二進位制）
2020-12-26
進位制之間的轉換之“十六進位制轉十進位制轉二進位制方案”
2024-04-07
MySQL二進位制檔案（binlog）
2020-12-04
MySql
前端怎麼處理二進位制檔案下載
2019-07-05
前端
Redis中快取二進位制資料
2024-07-27
Redis快取
二進位制轉十進位制快速方法
2020-11-17
二進位制（小白進軍程式設計師）
2020-12-28
程式設計師
[計算機基礎] 計算機進位制轉換：二進位制、八進位制、十進位制、十六進位制
2020-03-16
計算機
什麼是二進位制？二進位制如何轉換？
2018-12-12
二進位制檔案視覺化（二）
2022-06-02
視覺化
一看就懂二進位制、八進位制、十六進位制數轉換十進位制
2021-07-31
關於10進位制轉2進位制的C語言程式碼
2019-04-01
C語言
JavaScript十進位制轉換為二進位制
2018-07-03
JavaScript
十進位制轉二進位制推導（草稿）
2024-10-05
Cocoapods 二進位制
2019-04-23
04 二進位制
2024-10-26
leetcode -- 二進位制
2021-06-05
LeetCode
Git處理二進位制檔案
2018-07-14
Git
檔案操作（二進位制拷貝）
2019-07-21
使用POST方法傳輸二進位制資料
2023-11-22

前端進階：二進位制資料的操控—-附專案程式碼

1. 資料請求arraybuffer：

2. 資料讀取ArrayBuffer和DataView：