深入 JavaScript 陣列:進化與效能

發表於2017-09-18

正式開始前需要宣告,本文並不是要講解 JavaScript 陣列基礎知識,也不會涉及語法和使用案例。本文講得更多的是記憶體、優化、語法差異、效能、近來的演進。

在使用 JavaScript 前,我對 C、C++、C# 這些已經頗為熟悉。與許多 C/C++ 開發者一樣,JavaScript 給我的第一印象並不好。

Array 是主要原因之一。JavaScript 陣列不是連續(contiguous)的,其實現類似雜湊對映(hash-maps)或字典(dictionaries)。我覺得這有點像是一門 B 級語言,陣列實現根本不恰當。自那以後,JavaScript 和我對它的理解都發生了變化,很多變化。

為什麼說 JavaScript 陣列不是真正的陣列

在聊 JavaScript 之前,先講講 Array 是什麼。

陣列是一串連續的記憶體位置,用來儲存某些值。注意重點,“連續”(continuous,或 contiguous),這很重要。

t013e8a7ea0ed65a53e

上圖展示了陣列在記憶體中儲存方式。這個陣列儲存了 4 個元素,每個元素 4 位元組。加起來總共佔用了 16 位元組的記憶體區。

假設我們宣告瞭 tinyInt arr[4];,分配到的記憶體區的地址從 1201 開始。一旦需要讀取 arr[2],只需要通過數學計算拿到 arr[2] 的地址即可。計算 1201 + (2 X 4),直接從 1209 開始讀取即可。

t0108bfb507aa331fad

JavaScript 中的資料是雜湊對映,可以使用不同的資料結構來實現,如連結串列。所以,如果在 JavaScript 中宣告一個陣列 var arr = new Array(4),計算機將生成類似上圖的結構。如果程式需要讀取 arr[2],則需要從 1201 開始遍歷定址。

以上急速 JavaScript 陣列與真實陣列的不同之處。顯而易見,數學計算比遍歷連結串列快。就長陣列而言,情況尤其如此。

JavaScript 陣列的進化

不知你是否記得我們對朋友入手的 256MB 記憶體的電腦羨慕得要死的日子?而今天,8GB 記憶體遍地都是。

與此類似,JavaScript 這門語言也進化了不少。從 V8、SpiderMonkey 到 TC39 和與日俱增的 Web 使用者,巨大的努力已經使 JavaScript 成為世界級必需品。一旦有了龐大的使用者基礎,效能提升自然是硬需求。

實際上,現代 JavaScript 引擎是會給陣列分配連續記憶體的 —— 如果陣列是同質的(所有元素型別相同)。優秀的程式設計師總會保證陣列同質,以便 JIT(即時編譯器)能夠使用 c 編譯器式的計算方法讀取元素。

不過,一旦你想要在某個同質陣列中插入一個其他型別的元素,JIT 將解構整個陣列,並按照舊有的方式重新建立。

因此,如果你的程式碼寫得不太糟,JavaScript Array 物件在幕後依然保持著真正的陣列形式,這對現代 JS 開發者來說極為重要。

此外,陣列跟隨 ES2015/ES6 有了更多的演進。TC39 決定引入型別化陣列(Typed Arrays),於是我們就有了 ArrayBuffer

ArrayBuffer 提供一塊連續記憶體供我們隨意操作。然而,直接操作記憶體還是太複雜、偏底層。於是便有了處理 ArrayBuffer 的檢視(View)。目前已有一些可用檢視,未來還會有更多加入。

瞭解更多關於型別化陣列(Typed Arrays)的知識,請訪問 MDN 文件

高效能、高效率的型別化陣列在 WebGL 之後被引入。WebGL 工作者遇到了極大的效能問題,即如何高效處理二進位制資料。另外,你也可以使用 SharedArrayBuffer 在多個 Web Worker 程式之間共享資料,以提升效能。

從簡單的雜湊對映到現在的 SharedArrayBuffer,這相當棒吧?

舊式陣列 vs 型別化陣列:效能

前面已經討論了 JavaScript 陣列的演進,現在來測試現代陣列到底能給我們帶來多大收益。下面是我在 Mac 上使用 Node.js 8.4.0 進行的一些微型測試結果。

舊式陣列:插入

用時:55ms

Typed Array:插入

用時:52ms

擦,我看到了什麼?舊式陣列和 ArrayBuffer 的效能不相上下?不不不。請記住,前面提到過,現代編譯器已經智慧化,能夠將元素型別相同的傳統陣列在內部轉換成記憶體連續的陣列。第一個例子正是如此。儘管使用了 new Array(LIMIT),陣列實際依然以現代陣列形式存在。

接著修改第一例子,將陣列改成異構型(元素型別不完全一致)的,來看看是否存在效能差異。

舊式陣列:插入(異構)

用時:1207ms

改變發生在第 3 行,新增一條語句,將陣列變為異構型別。其餘程式碼保持不變。效能差異表現出來了,慢了 22 倍

舊式陣列:讀取

用時:196ms

Typed Array:讀取

用時:27ms

結論

型別化陣列的引入是 JavaScript 發展歷程中的一大步。Int8Array,Uint8Array,Uint8ClampedArray,Int16Array,Uint16Array,Int32Array,Uint32Array,Float32Array,Float64Array,這些是型別化陣列檢視,使用原生位元組序(與本機相同)。我們還可以使用 DataView 建立自定義檢視視窗。希望未來會有更多幫助我們輕鬆操作 ArrayBuffer 的 DataView 庫。

JavaScript 陣列的演進非常 nice。現在它們速度快、效率高、健壯,在記憶體分配時也足夠智慧。

 

相關文章