時間複雜度為O(nlogn)的排序演算法

樂多i發表於2020-07-21

原文網址 : https://www.cnblogs.com/leduoi/p/13357082.html

時間複雜度排序演算法

時間複雜度為O(nlogn)的排序演算法（歸併排序、快速排序）,比時間複雜度O(n²)的排序演算法更適合大規模資料排序。

歸併排序

歸併排序的核心思想

採用“分治思想”，將要排序的陣列從中間分成前後兩個部分，然後對前後兩個部分分別進行排序，再將排序好的兩部分合並在一起，這樣陣列就有序了。

分治是一種解決問題的思想，遞迴是一種程式設計技巧，使用遞迴的技巧就是，先找到遞迴公式和終止條件，然後將遞迴公式翻譯成遞迴程式碼。

歸併排序的遞推公式和終止條件：

//遞迴公式
merge_sort(p...r) = mege(merge_sort(p...q),merge_sort(q+1,r));

//終止條件
p >= r,不再繼續分解

歸併排序程式碼

public class MergeSort {

    public static void main(String[] args) {
        int[] a = {4, 3, 2, 1, 6, 5};
        mergeSort(a,0,a.length - 1);
        for (int i : a) {
            System.out.println(i);
        }
    }

    public static void mergeSort(int[] a, int p, int r) {
        //終止條件
        if (p >= r) return;

        int q = (r - p) / 2 + p;
        //遞迴公式
        mergeSort(a, 0, q);
        mergeSort(a, q + 1, r);

        //到這裡遞迴結束，可以假設[0,q],[q + 1,r]已經排好序了
        merge(a, p, q, r);

    }

    private static void merge(int[] a, int p, int q, int r) {
        int i = p;
        int j = q + 1;
        int k = 0;
        int[] temp = new int[r - p + 1];
        while (i <= q && j <= r) {
            if (a[i] <= a[j]) {
                temp[k++] = a[i++];
            } else {
                temp[k++] = a[j++];
            }
        }

        //判斷哪個子數字中有資料，判斷依據必須是 <=
        int start = i;
        int end = q;
        if (j <= r) {
            start = j;
            end = r;
        }

        //將剩餘資料拷貝到臨時陣列temp中
        while (start <= end) {
            temp[k++] = a[start++];
        }

        //將temp陣列中資料[0,r-p]，拷貝至a陣列中原來位置
        //可以直接使用陣列複製函式
        for (int n = 0; n <= r - p; n++) {
            a[p + n] = temp[n];
        }
    }
}

優化

可以利用哨兵節點對merge方法進行優化，將陣列分配兩部分，並將Integer.MAX_VALUE新增到每個陣列的最後一位，就可以一次性將兩個陣列中資料全部比較完，不會剩餘資料

//優化merge程式碼
private static void mergeBySentry(int[] a, int p, int q, int r) {
    int[] leftArr = new int[q - p + 2];
    int[] rightArr = new int[r - q + 1];

    for (int i = 0; i <= q - p; i++) {
        leftArr[i] = a[p + i];
    }
    leftArr[q - p + 1] = Integer.MAX_VALUE;

    for (int i = 0; i < r - q; i++) {
        rightArr[i] = a[q + i + 1];
    }
    rightArr[r - q] = Integer.MAX_VALUE;


    int i = 0;
    int j = 0;
    int k = p;
    while (k <= r) {
        if (leftArr[i] <= rightArr[j]) {
            a[k++] = leftArr[i++];
        } else {
            a[k++] = rightArr[j++];
        }
    }
}

穩定性

歸併排序是穩定的排序演算法，是否穩定取決於合併merge方法，當兩個陣列有相同資料合併時，可以先將左邊的資料先存入temp中，這樣就可以保證穩定性

時間複雜度

最好情況、最壞情況，還是平均情況，時間複雜度都是 O(nlogn)。推導過程待補充...

空間複雜度

歸併排序不是原地排序演算法。

遞迴程式碼的空間複雜度並不能像時間複雜度那樣累加。剛剛我們忘記了最重要的一點，那就是，儘管每次合併操作都需要申請額外的記憶體空間，但在合併完成之後，臨時開闢的記憶體空間就被釋放掉了。在任意時刻，CPU 只會有一個函式在執行，也就只會有一個臨時的記憶體空間在使用。臨時記憶體空間最大也不會超過 n 個資料的大小，所以空間複雜度是 O(n)

快速排序

快速排序核心思想

對陣列p到r進行排序，從陣列中從中取出一個資料作為pivot（分割槽點），將小於pivot的放在左邊，大於pivot的放在右邊，之後利用分治、遞迴思想，再對左右兩邊的資料進行排序，直到區間縮小為1，說明資料有序了

遞迴公式和終止條件

//遞迴公式
quick_sort(p...r) = quick_sort(p...q) + quick_sort(q + 1 ... r)  
    
//終止條件
p >= r

快速排序程式碼

public static void quickSort(int[] a, int n){
    quickSortInternally(a,0,n - 1);
}

private static void quickSortInternally(int[] a,int p, int r){
    if (p >= r) return;

    int q = partition(a, p, r);
    quickSortInternally(a,p,q - 1);
    quickSortInternally(a,q + 1,r);
}

//p:起始位置，r:終止位置
private static int partition(int[] a, int p, int r) {
    //取出中間點
    int pivot = a[r];

    //i、j為雙指標，i始終指向大於中間點的第一個元素，j不斷遍歷陣列，最終指向最後一個元素即中間點
    int i = p;
    //比較從p開始，到r-1結束
    for(int j = p; j < r; ++j) {
        //如果小於中間點
        if (a[j] < pivot) {
            if (i == j) {
                //如果i和j相等，說明之前沒有大於中間點的元素，i和j都加1
                // j在進行下一輪迴圈的時候會自動加1，所以在這裡只加i
                ++i;
            } else {
                //如果不相等，說明i已經指向第一個大於中間點的元素
                // 需要將小於中間的的a[j]與a[i]交換位置，然後都加1
                int tmp = a[i];
                a[i++] = a[j];
                a[j] = tmp;
            }
        }
    }

    //迴圈結束，i指向大於中間點a[r]的第一個元素
    //將a[i]與a[r]交換位置
    int tmp = a[i];
    a[i] = a[r];
    a[r] = tmp;

    System.out.println("i=" + i);
    //返回交換後中間點座標位置
    return i;
}

效能分析

快速排序是原地、不穩定的排序演算法，時間複雜度在大部分情況下的時間複雜度都可以做到 O(nlogn)，只有在極端情況下，才會退化到 O(n²)

原地：空間複雜度為O(1)，不需要佔用額外儲存空間

不穩定：因為分割槽的過程涉及交換操作，如果陣列中有兩個相同的元素，比如序列 6，8，7，6，3，5，9，4，在經過第一次分割槽操作之後，兩個 6 的相對先後順序就會改變。所以，快速排序並不是一個穩定的排序演算法

時間複雜度：待補充

思考

O(n) 時間複雜度內求無序陣列中的第 K 大元素。比如，4， 2， 5， 12， 3 這樣一組資料，第 3 大元素就是 4。

思路：

選擇陣列A[0,n-1]的最後一個元素A[n-1]作為中間點pivot
對陣列A[0,n-1]原地分割槽，分為[0,p-1],[p],[p+1,n-1],此時[0,p-1]這個分割槽中雖然可能無序，但是全部是比中間點小的元素，所以[p]為這群數中的第p+1大元素（下標為p，所以共有p+1個元素，應該是p+1大）
比較p+1和K，如果p+1 = K，說明A[p]就是求解元素，如果K > p+1，說明求解元素出現在A[p+1,n-1]中，則按照上面方法遞迴對A[p+1,n-1]進行分去查詢，同理，如果K < p+1，則對A[0,p-1]進行分割槽查詢

時間複雜度：O(n)。第一次分割槽查詢，我們需要對大小為 n 的陣列執行分割槽操作，需要遍歷 n 個元素。第二次分割槽查詢，我們只需要對大小為 n/2 的陣列執行分割槽操作，需要遍歷 n/2 個元素。依次類推，分割槽遍歷元素的個數分別為、n/2、n/4、n/8、n/16.……直到區間縮小為 1。如果我們把每次分割槽遍歷的元素個數加起來，就是：n+n/2+n/4+n/8+…+1。這是一個等比數列求和，最後的和等於 2n-1。所以，上述解決思路的時間複雜度就為 O(n)。

笨方法：每次取陣列中的最小值，將其移動到陣列的最前面，然後在剩下的陣列中繼續找最小值，以此類推，執行 K 次，也可以找到第K大元素。但這種方法的時間複雜度為O(K*n),在K值比較小時，時間複雜度為O(n),當K為n/2或n時，時間複雜度就為O(n²)了

思考2

現在你有 10 個介面訪問日誌檔案，每個日誌檔案大小約 300MB，每個檔案裡的日誌都是按照時間戳從小到大排序的。你希望將這 10 個較小的日誌檔案，合併為 1 個日誌檔案，合併之後的日誌仍然按照時間戳從小到大排列。如果處理上述排序任務的機器記憶體只有 1GB，你有什麼好的解決思路，能“快速”地將這 10 個日誌檔案合併嗎

時間複雜度為 O(nlogn) 的排序演算法
2023-11-27
時間複雜度排序演算法
快速排序平均時間複雜度O(nlogn)的推導
2021-11-13
排序時間複雜度
時間複雜度為 O (n^2) 的排序演算法
2018-10-23
時間複雜度排序演算法
時間複雜度為 O(n^2) 的排序演算法
2024-10-17
時間複雜度排序演算法
時間複雜度O(1)、O(n)、O(n²)、O(nlogn)的含義
2019-05-27
時間複雜度
Java實現：排序演算法--時間複雜度為O（n² ）
2018-03-07
Java排序演算法時間複雜度
時間複雜度O(n)和空間複雜度
2019-03-27
時間複雜度
排序演算法：堆排序的實現和時間複雜度分析
2021-12-03
排序演算法時間複雜度
演算法的時間複雜度
2019-01-08
演算法時間複雜度
氣泡排序時間複雜度分析
2024-03-09
排序時間複雜度
122 演算法的時間複雜度和空間複雜度詳解
2018-08-27
演算法時間複雜度
如何不用演算法對陣列進行(0時間複雜度，0空間複雜度)排序？
2019-01-11
演算法陣列時間複雜度排序
時間複雜度跟空間複雜度
2018-09-28
時間複雜度
時間複雜度與空間複雜度
2022-04-11
時間複雜度
時間複雜度和空間複雜度
2022-03-22
時間複雜度
演算法（一）時間複雜度
2019-03-04
演算法時間複雜度
演算法分析__時間複雜度
2019-03-05
演算法時間複雜度
卷演算法——時間複雜度
2021-11-10
演算法時間複雜度
解惑3：時間頻度，演算法時間複雜度
2020-06-27
演算法時間複雜度
遞迴演算法的時間複雜度
2019-09-05
遞迴演算法時間複雜度
判斷連結串列是否為迴文結構，空間負責度為O(1)，時間複雜度為O(n)
2018-09-15
時間複雜度
PHP 演算法基礎----時間複雜度和空間複雜度（轉載）
2019-03-13
PHP演算法時間複雜度
【基礎】演算法的時間複雜度分析
2020-10-05
演算法時間複雜度
時間複雜度怎麼算？如何計算時間複雜度？
2019-07-24
時間複雜度
說說你對演算法中時間複雜度，空間複雜度的理解？如何計算？
2024-04-09
演算法時間複雜度
用一個測試類簡化排序演算法時間複雜度的研究
2020-06-06
排序演算法時間複雜度
演算法的空間複雜度
2021-01-02
演算法複雜度
時間複雜度的計算
2018-11-06
時間複雜度
一文講透演算法中的時間複雜度和空間複雜度計算方式
2021-12-11
演算法時間複雜度
我們常說的演算法時間複雜度和空間複雜度到底是什麼？
2021-06-30
演算法時間複雜度
【漫畫】為什麼說O(n)複雜度的基數排序沒有快速排序快？
2019-01-09
複雜度排序
圖解時間複雜度
2019-02-21
圖解時間複雜度
淺談時間複雜度
2024-07-16
時間複雜度
dfs時間複雜度分析
2022-02-01
時間複雜度
時間複雜度（詳解）
2021-10-21
時間複雜度
隨機列印0-100的全部數字並且不可重複，時間複雜度為O(n)
2020-12-30
隨機時間複雜度
演算法分析__時間複雜度的五個記號
2019-03-05
演算法時間複雜度
常見排序演算法及複雜度
2022-03-24
排序演算法複雜度