JavaScript專題之解讀 v8 排序原始碼

冴羽發表於2017-10-19

JavaScript排序原始碼

JavaScript 專題系列第二十篇，也是最後一篇，解讀 v8 排序原始碼

前言

v8 是 Chrome 的 JavaScript 引擎，其中關於陣列的排序完全採用了 JavaScript 實現。

排序採用的演算法跟陣列的長度有關，當陣列長度小於等於 10 時，採用插入排序，大於 10 的時候，採用快速排序。(當然了，這種說法並不嚴謹)。

我們先來看看插入排序和快速排序。

插入排序

原理

將第一個元素視為有序序列，遍歷陣列，將之後的元素依次插入這個構建的有序序列中。

圖示

實現

function insertionSort(arr) {
    for (var i = 1; i < arr.length; i++) {
        var element = arr[i];
        for (var j = i - 1; j >= 0; j--) {
            var tmp = arr[j];
            var order = tmp - element;
            if (order > 0) {
                arr[j + 1] = tmp;
            } else {
                break;
            }
        }
        arr[j + 1] = element;
    }
    return arr;
}

var arr = [6, 5, 4, 3, 2, 1];
console.log(insertionSort(arr));複製程式碼

時間複雜度

時間複雜度是指執行演算法所需要的計算工作量，它考察當輸入值大小趨近無窮時的情況，一般情況下，演算法中基本操作重複執行的次數是問題規模 n 的某個函式。

最好情況：陣列升序排列，時間複雜度為：O(n)

最壞情況：陣列降序排列，時間複雜度為：O(n²)

穩定性

穩定性，是指相同的元素在排序後是否還保持相對的位置。

要注意的是對於不穩定的排序演算法，只要舉出一個例項，即可說明它的不穩定性；而對於穩定的排序演算法，必須對演算法進行分析從而得到穩定的特性。

比如 [3, 3, 1]，排序後，還是 [3, 3, 1]，但是其實是第二個 3 在第一個 3 前，那這就是不穩定的排序演算法。

插入排序是穩定的演算法。

優勢

當陣列是快要排序好的狀態或者問題規模比較小的時候，插入排序效率更高。這也是為什麼 v8 會在陣列長度小於等於 10 的時候採用插入排序。

快速排序

原理

選擇一個元素作為"基準"
小於"基準"的元素，都移到"基準"的左邊；大於"基準"的元素，都移到"基準"的右邊。
對"基準"左邊和右邊的兩個子集，不斷重複第一步和第二步，直到所有子集只剩下一個元素為止。

示例

示例和下面的實現方式來源於阮一峰老師的《快速排序（Quicksort）的Javascript實現》

以陣列 [85, 24, 63, 45, 17, 31, 96, 50] 為例：

第一步，選擇中間的元素 45 作為"基準"。（基準值可以任意選擇，但是選擇中間的值比較容易理解。）

第二步，按照順序，將每個元素與"基準"進行比較，形成兩個子集，一個"小於45"，另一個"大於等於45"。

第三步，對兩個子集不斷重複第一步和第二步，直到所有子集只剩下一個元素為止。

實現

var quickSort = function(arr) {
　　if (arr.length <= 1) { return arr; }
    // 取陣列的中間元素作為基準
　　var pivotIndex = Math.floor(arr.length / 2);
　　var pivot = arr.splice(pivotIndex, 1)[0];

　　var left = [];
　　var right = [];

　　for (var i = 0; i < arr.length; i++){
　　　　if (arr[i] < pivot) {
　　　　　　left.push(arr[i]);
　　　　} else {
　　　　　　right.push(arr[i]);
　　　　}
　　}
　　return quickSort(left).concat([pivot], quickSort(right));
};複製程式碼

然而這種實現方式需要額外的空間用來儲存左右子集，所以還有一種原地(in-place)排序的實現方式。

圖示

我們來看看原地排序的實現圖示：

為了讓大家看明白快速排序的原理，我調慢了執行速度。

在這張示意圖裡，基準的取值規則是取最左邊的元素，黃色代表當前的基準，綠色代表小於基準的元素，紫色代表大於基準的元素。

我們會發現，綠色的元素會緊挨在基準的右邊，紫色的元素會被移到後面，然後交換基準和綠色的最後一個元素，此時，基準處於正確的位置，即前面的元素都小於基準值，後面的元素都大於基準值。然後再對前面的和後面的多個元素取基準，做排序。

in-place 實現

function quickSort(arr) {
    // 交換元素
    function swap(arr, a, b) {
        var temp = arr[a];
        arr[a] = arr[b];
        arr[b] = temp;
    }

    function partition(arr, left, right) {
        var pivot = arr[left];
        var storeIndex = left;

        for (var i = left + 1; i <= right; i++) {
            if (arr[i] < pivot) {
                swap(arr, ++storeIndex, i);
            }
        }

        swap(arr, left, storeIndex);

        return storeIndex;
    }

    function sort(arr, left, right) {
        if (left < right) {
            var storeIndex = partition(arr, left, right);
            sort(arr, left, storeIndex - 1);
            sort(arr, storeIndex + 1, right);
        }
    }

    sort(arr, 0, arr.length - 1);

    return arr;
}

console.log(quickSort(6, 7, 3, 4, 1, 5, 9, 2, 8))複製程式碼

穩定性

快速排序是不穩定的排序。如果要證明一個排序是不穩定的，你只用舉出一個例項就行。

所以我們舉一個唄~

就以陣列 [1, 2, 3, 3, 4, 5] 為例，因為基準的選擇不確定，假如選定了第三個元素(也就是第一個 3) 為基準，所有小於 3 的元素在前面，大於等於 3 的在後面，排序的結果沒有問題。可是如果選擇了第四個元素(也就是第二個 3 )，小於 3 的在基準前面，大於等於 3 的在基準後面，第一個 3 就會被移動到第二個 3 後面，所以快速排序是不穩定的排序。

時間複雜度

阮一峰老師的實現中，基準取的是中間元素，而原地排序中基準取最左邊的元素。快速排序的關鍵點就在於基準的選擇，選取不同的基準時，會有不同效能表現。

快速排序的時間複雜度最好為 O(nlogn)，可是為什麼是 nlogn 呢？來一個並不嚴謹的證明：

在最佳情況下，每一次都平分整個陣列。假設陣列有 n 個元素，其遞迴的深度就為 log₂n + 1，時間複雜度為 O(n)[(log₂n + 1)]，因為時間複雜度考察當輸入值大小趨近無窮時的情況，所以會忽略低階項，時間複雜度為：o(nlog₂n)。

如果一個程式的執行時間是對數級的，則隨著 n 的增大程式會漸漸慢下來。如果底數是 10，lg1000 等於 3，如果 n 為 1000000，lgn 等於 6，僅為之前的兩倍。如果底數為 2，log₂1000 的值約為 10，log₂1000000 的值約為 19，約為之前的兩倍。我們可以發現任意底數的一個對數函式其實都相差一個常數倍而已。所以我們認為 O(logn)已經可以表達所有底數的對數了，所以時間複雜度最後為： O(nlogn)。

而在最差情況下，如果對一個已經排序好的陣列，每次選擇基準元素時總是選擇第一個元素或者最後一個元素，那麼每次都會有一個子集是空的，遞迴的層數將達到 n，最後導致演算法的時間複雜度退化為 O(n²)。

這也充分說明了一個基準的選擇是多麼的重要，而 v8 為了提高效能，就對基準的選擇做了很多優化。

v8 基準選擇

v8 選擇基準的原理是從頭和尾之外再選擇一個元素，然後三個值排序取中間值。

當陣列長度大於 10 但是小於 1000 的時候，取中間位置的元素，實現程式碼為：

// 基準的下標
// >> 1 相當於除以 2 (忽略餘數)
third_index = from + ((to - from) >> 1);複製程式碼

當陣列長度大於 1000 的時候，每隔 200 ~ 215 個元素取一個值，然後將這些值進行排序，取中間值的下標，實現的程式碼為：

// 簡單處理過
function GetThirdIndex(a, from, to) {
    var t_array = new Array();

    // & 位運算子
    var increment = 200 + ((to - from) & 15);

    var j = 0;
    from += 1;
    to -= 1;

    for (var i = from; i < to; i += increment) {
        t_array[j] = [i, a[i]];
        j++;
    }
    // 對隨機挑選的這些值進行排序
    t_array.sort(function(a, b) {
        return comparefn(a[1], b[1]);
    });
    // 取中間值的下標
    var third_index = t_array[t_array.length >> 1][0];
    return third_index;
}複製程式碼

也許你會好奇 200 + ((to - from) & 15) 是什麼意思？

& 表示是按位與，對整數運算元逐位執行布林與操作。只有兩個運算元中相對應的位都是 1，結果中的這一位才是 1。

以 15 & 127 為例：

15 二進位制為：（0000 1111）

127 二進位制為：（1111 1111）

按位與結果為：（0000 1111）＝ 15

所以 15 & 127 的結果為 15。

注意 15 的二進位制為： 1111，這就意味著任何和 15 按位與的結果都會小於或者等於 15，這才實現了每隔 200 ~ 215 個元素取一個值。

v8 原始碼

終於到了看原始碼的時刻！原始碼地址為：github.com/v8/v8/blob/…。

function InsertionSort(a, from, to) {
    for (var i = from + 1; i < to; i++) {
        var element = a[i];
        for (var j = i - 1; j >= from; j--) {
            var tmp = a[j];
            var order = comparefn(tmp, element);
            if (order > 0) {
                a[j + 1] = tmp;
            } else {
                break;
            }
        }
        a[j + 1] = element;
    }
};


function QuickSort(a, from, to) {

    var third_index = 0;
    while (true) {
            // Insertion sort is faster for short arrays.
        if (to - from <= 10) {
            InsertionSort(a, from, to);
            return;
        }
        if (to - from > 1000) {
            third_index = GetThirdIndex(a, from, to);
        } else {
            third_index = from + ((to - from) >> 1);
        }
        // Find a pivot as the median of first, last and middle element.
        var v0 = a[from];
        var v1 = a[to - 1];
        var v2 = a[third_index];

        var c01 = comparefn(v0, v1);
        if (c01 > 0) {
            // v1 < v0, so swap them.
            var tmp = v0;
            v0 = v1;
            v1 = tmp;
        } // v0 <= v1.
        var c02 = comparefn(v0, v2);
        if (c02 >= 0) {
            // v2 <= v0 <= v1.
            var tmp = v0;
            v0 = v2;
            v2 = v1;
            v1 = tmp;
        } else {
            // v0 <= v1 && v0 < v2
            var c12 = comparefn(v1, v2);
            if (c12 > 0) {
                // v0 <= v2 < v1
                var tmp = v1;
                v1 = v2;
                v2 = tmp;
            }
        }

        // v0 <= v1 <= v2
        a[from] = v0;
        a[to - 1] = v2;

        var pivot = v1;

        var low_end = from + 1; // Upper bound of elements lower than pivot.
        var high_start = to - 1; // Lower bound of elements greater than pivot.

        a[third_index] = a[low_end];
        a[low_end] = pivot;

        // From low_end to i are elements equal to pivot.
        // From i to high_start are elements that haven't been compared yet.

        partition: for (var i = low_end + 1; i < high_start; i++) {
            var element = a[i];
            var order = comparefn(element, pivot);
            if (order < 0) {
                a[i] = a[low_end];
                a[low_end] = element;
                low_end++;
            } else if (order > 0) {
                do {
                    high_start--;
                    if (high_start == i) break partition;
                    var top_elem = a[high_start];
                    order = comparefn(top_elem, pivot);
                } while (order > 0);

                a[i] = a[high_start];
                a[high_start] = element;
                if (order < 0) {
                    element = a[i];
                    a[i] = a[low_end];
                    a[low_end] = element;
                    low_end++;
                }
            }
        }


        if (to - high_start < low_end - from) {
            QuickSort(a, high_start, to);
            to = low_end;
        } else {
            QuickSort(a, from, low_end);
            from = high_start;
        }
    }
}

var arr = [10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0];

function comparefn(a, b) {
    return a - b
}

QuickSort(arr, 0, arr.length)
console.log(arr)複製程式碼

我們以陣列 [10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0] 為例，分析執行的過程。

1.執行 QuickSort 函式引數 from 值為 0，引數 to 的值 11。

2.10 < to - from < 1000 第三個基準元素的下標為 (0 + 11 >> 1) = 5，基準值 a[5] 為 5。

3.比較 a[0] a[10] a[5] 的值，然後根據比較結果修改陣列，陣列此時為 [0, 9, 8, 7, 6, 5, 4, 3, 2, 1, 10]

4.將基準值和陣列的第(from + 1)個即陣列的第二個元素互換，此時陣列為 [0, 5, 8, 7, 6, 9, 4, 3, 2, 1, 10]，此時在基準值 5 前面的元素肯定是小於 5 的，因為第三步已經做了一次比較。後面的元素是未排序的。

我們接下來要做的就是把後面的元素中小於 5 的全部移到 5 的前面。

5.然後我們進入 partition 迴圈，我們依然以這個陣列為例，單獨抽出來寫個 demo 講一講

// 假設程式碼執行到這裡，為了方便演示，我們直接設定 low_end 等變數的值
// 可以直接複製到瀏覽器中檢視陣列變換效果
var a = [0, 5, 8, 7, 6, 9, 4, 3, 2, 1, 10]
var low_end = 1;
var high_start = 10;
var pivot = 5;

console.log('起始陣列為', a)

partition: for (var i = low_end + 1; i < high_start; i++) {

    var element = a[i];
    console.log('迴圈當前的元素為：', a[i])
    var order = element - pivot;

    if (order < 0) {
        a[i] = a[low_end];
        a[low_end] = element;
        low_end++;
        console.log(a)
    }
    else if (order > 0) {
        do {
            high_start--;
            if (high_start == i) break partition;
            var top_elem = a[high_start];
            order = top_elem - pivot;
        } while (order > 0);

        a[i] = a[high_start];
        a[high_start] = element;

        console.log(a)

        if (order < 0) {
            element = a[i];
            a[i] = a[low_end];
            a[low_end] = element;
            low_end++;
        }
        console.log(a)
    }
}

console.log('最後的結果為', a)
console.log(low_end)
console.log(high_start)複製程式碼

6.此時陣列為 [0, 5, 8, 7, 6, 9, 4, 3, 2, 1, 10]，迴圈從第三個元素開始，a[i] 的值為 8，因為大於基準值 5，即 order > 0，開始執行 do while 迴圈，do while 迴圈的目的在於倒序查詢元素，找到第一個小於基準值的元素，然後讓這個元素跟 a[i] 的位置交換。
第一個小於基準值的元素為 1，然後 1 與 8 交換，陣列變成 [0, 5, 1, 7, 6, 9, 4, 3, 2, 8, 10]。high_start 的值是為了記錄倒序查詢到哪裡了。

7.此時 a[i] 的值變成了 1，然後讓 1 跟基準值 5 交換，陣列變成了 [0, 1, 5, 7, 6, 9, 4, 3, 2, 8, 10]，low_end 的值加 1，low_end 的值是為了記錄基準值的所在位置。

8.迴圈接著執行，遍歷第四個元素 7，跟第 6、7 的步驟一致，陣列先變成 [0, 1, 5, 2, 6, 9, 4, 3, 7, 8, 10]，再變成 [0, 1, 2, 5, 6, 9, 4, 3, 7, 8, 10]

9.遍歷第五個元素 6，跟第 6、7 的步驟一致，陣列先變成 [0, 1, 2, 5, 3, 9, 4, 6, 7, 8, 10]，再變成 [0, 1, 2, 3, 5, 9, 4, 6, 7, 8, 10]

10.遍歷第六個元素 9，跟第 6、7 的步驟一致，陣列先變成 [0, 1, 2, 3, 5, 4, 9, 6, 7, 8, 10]，再變成 [0, 1, 2, 3, 4, 5, 9, 6, 7, 8, 10]

11.在下一次遍歷中，因為 i == high_start，意味著正序和倒序的查詢終於找到一起了，後面的元素肯定都是大於基準值的，此時退出迴圈

12.遍歷後的結果為 [0, 1, 2, 3, 4, 5, 9, 6, 7, 8, 10]，在基準值 5 前面的元素都小於 5，後面的元素都大於 5，然後我們分別對兩個子集進行 QuickSort

13.此時 low_end 值為 5，high_start 值為 6，to 的值依然是 10，from 的值依然是 0，to - high_start < low_end - from 的結果為 true，我們對 QuickSort(a, 6, 10)，即對後面的元素進行排序，但是注意，在新的 QuickSort 中，因為 from - to 的值小於 10，所以這一次其實是採用了插入排序。所以準確的說，當陣列長度大於 10 的時候，v8 採用了快速排序和插入排序的混合排序方法。

14.然後 to = low_end 即設定 to 為 5，因為 while(true) 的原因，會再執行一遍，to - from 的值為 5，執行 InsertionSort(a, 0, 5)，即對基準值前面的元素執行一次插入排序。

15.因為在 to - from <= 10 的判斷中，有 return 語句，所以 while 迴圈結束。

16.v8 在對陣列進行了一次快速排序後，然後對兩個子集分別進行了插入排序，最終修改陣列為正確排序後的陣列。

比較

最後來張示意圖感受下插入排序和快速排序：

圖片來自於 www.toptal.com/developers/…

專題系列

JavaScript專題系列目錄地址：github.com/mqyqingfeng…。

JavaScript專題系列預計寫二十篇左右，主要研究日常開發中一些功能點的實現，比如防抖、節流、去重、型別判斷、拷貝、最值、扁平、柯里、遞迴、亂序、排序等，特點是研(chao)究(xi) underscore 和 jQuery 的實現方式。

如果有錯誤或者不嚴謹的地方，請務必給予指正，十分感謝。如果喜歡或者有所啟發，歡迎 star，對作者也是一種鼓勵。

go 中 sort 如何排序，原始碼解讀
2022-03-06
Go排序原始碼
從 V8 原始碼看 JS 陣列排序的詭異問題
2017-08-12
原始碼JS陣列排序
React原始碼解讀之setState
2018-07-20
React原始碼
React原始碼解讀之componentMount
2018-07-18
React原始碼
DeepSort之原始碼解讀
2022-04-05
原始碼
【原始碼解讀(一)】EFCORE原始碼解讀之建立DBContext查詢攔截
2023-10-13
原始碼Context
Element UI 原始碼解讀之 Table 元件
2019-03-04
UI原始碼元件
elastic-job 原始碼解讀之從原始碼看null值
2021-09-09
AST原始碼Null
DRF之排序類原始碼分析
2024-04-23
排序原始碼
D3原始碼解讀系列之Chord
2019-11-01
原始碼
D3原始碼解讀系列之Dispatches
2019-11-01
原始碼
D3原始碼解讀系列之Force
2019-11-01
原始碼
D3原始碼解讀系列之Hierarchies
2019-11-01
原始碼
D3原始碼解讀系列之Path
2019-11-01
原始碼
D3原始碼解讀系列之Requests
2019-11-01
原始碼
小程式之豆瓣電影原始碼解讀
2017-01-20
原始碼
PostgreSQL 原始碼解讀（3）- 如何閱讀原始碼
2018-08-02
SQL原始碼
PostgreSQL 原始碼解讀（198）- 查詢#113(排序#6 - Tuplesortstate)
2019-05-27
SQL原始碼排序
WeakHashMap，原始碼解讀
2019-09-07
HashMap原始碼
Handler原始碼解讀
2019-02-26
原始碼
Laravel 原始碼解讀
2019-03-29
Laravel原始碼
Swoft 原始碼解讀
2019-02-16
原始碼
SDWebImage原始碼解讀
2019-01-18
Web原始碼
MJExtension原始碼解讀
2018-11-29
原始碼
Masonry原始碼解讀
2018-12-28
原始碼
HashMap原始碼解讀
2018-03-23
HashMap原始碼
Redux原始碼解讀
2018-05-01
Redux原始碼
require() 原始碼解讀
2015-05-20
UI原始碼
ZooKeeper原始碼解讀
2024-06-15
原始碼
FairyGUI原始碼解讀
2024-10-29
AIGUI原始碼
【原始碼閱讀】Glide原始碼閱讀之with方法（一）
2019-04-17
原始碼IDE
【原始碼閱讀】Glide原始碼閱讀之into方法（三）
2019-04-18
原始碼IDE
D3原始碼解讀系列之Quadtrees
2019-11-01
原始碼
D3原始碼解讀系列之Selections
2019-11-01
原始碼
D3原始碼解讀系列之Shape
2019-11-01
原始碼
Spring原始碼解讀之BeanFactoryPostProcessor的處理
2019-06-29
Spring原始碼Bean
RxJava2原始碼解讀之 Map、FlatMap
2018-08-05
RxJava原始碼
underscore 原始碼解讀之 bind 方法的實現
2016-09-06
原始碼

JavaScript專題之解讀 v8 排序原始碼

前言

插入排序

原理

圖示

實現

時間複雜度

穩定性

優勢

快速排序

原理

示例

實現

圖示

in-place 實現

穩定性

時間複雜度

v8 基準選擇

v8 原始碼

比較

專題系列

相關文章