無序陣列求第K大的數

Grey Zeng發表於2021-09-22

原文網址 : https://www.cnblogs.com/greyzeng/p/15320118.html

陣列

問題描述

無序陣列求第K大的數，其中K從1開始算。

例如：[0,3,1,8,5,2]這個陣列，第2大的數是5

OJ可參考：LeetCode_0215_KthLargestElementInAnArray

堆解法

設定一個小根堆，先把前K個數放入小根堆，對於這前K個數來說，堆頂元素一定是第K大的數，接下來的元素繼續入堆，但是每入一個就彈出一個，最後，堆頂元素就是整個陣列的第K大元素。程式碼如下：

    public static int findKthLargest3(int[] nums, int k) {
        PriorityQueue<Integer> h = new PriorityQueue<>();
        int i = 0;
        // 經歷這個迴圈，前K個數的第K大的數就是h的堆頂元素
        while (i < k) {
            h.offer(nums[i++]);
        }
        // 每次入一個，出一個，這樣就保證了堆頂元素永遠保持第K大的元素
        while (i < nums.length) {
            h.offer(nums[i++]);
            h.poll();
        }
        return h.peek();
    }

由於每次堆需要logK的調整代價, 所以這個解法的時間複雜度為O(N*logK)

改進快排演算法

快速排序中，有一個partition的過程, 程式碼如下，注：以下程式碼是從大到小排序的partition過程

    private static int[] partition(int[] nums, int l, int r, int pivot) {
        int i = l;
        int more = l - 1;//大於區域
        int less = r + 1; // 小於區域
        while (i < less) {
            if (nums[i] > pivot) {
                swap(nums, i++, ++more);
            } else if (nums[i] < pivot) {
                swap(nums, i, --less);
            } else {
                i++;
            }
        }
        return new int[]{more + 1, less - 1};
    }

這個過程主要的作用是將nums陣列的l...r區間內的數，將：

小於pivot的數放右邊
大於pivot的數放左邊
等於pivot的數放中間

返回兩個值，一個是左邊界和一個右邊界，位於左邊界和右邊界的值均等於pivot，小於左邊界的位置的值都大於pivot，大於右邊界的位置的值均小於pivot。簡言之：如果要排序，pivot這個值在一次partition以後，所在的位置就是最終排序後pivot應該在的位置。

所以，如果陣列中某個數在經歷上述partion之後正好位於K-1位置，那麼這個數就是整個陣列第K大的數。

完整程式碼如下：

public class LeetCode_0215_KthLargestElementInAnArray {
    
    // 快排改進演算法
    // 第K小 == 第 nums.length - k + 1 大
    public static int findKthLargest2(int[] nums, int k) {
        return p(nums, 0, nums.length - 1, k - 1);
    }
    // nums在L...R範圍上，如果要排序（從大到小）的話，請返回index位置的值
    public static int p(int[] nums, int L, int R, int index) {
        if (L == R) {
            return nums[L];
        }
        int pivot = nums[L + (int) (Math.random() * (R - L + 1))];
        int[] range = partition(nums, L, R, pivot);
        if (index >= range[0] && index <= range[1]) {
            return pivot;
        } else if (index < range[0]) {
            return p(nums, L, range[0] - 1, index);
        } else {
            return p(nums, range[1] + 1, R, index);
        }
    }
    private static int[] partition(int[] nums, int l, int r, int pivot) {
        int i = l;
        int more = l - 1;//大於區域
        int less = r + 1; // 小於區域
        while (i < less) {
            if (nums[i] > pivot) {
                swap(nums, i++, ++more);
            } else if (nums[i] < pivot) {
                swap(nums, i, --less);
            } else {
                i++;
            }
        }
        return new int[]{more + 1, less - 1};
    }

    public static void swap(int[] nums, int t, int m) {
        int tmp = nums[m];
        nums[m] = nums[t];
        nums[t] = tmp;
    }
}

其中p方法表示：nums在L...R範圍上，如果要排序（從大到小）的話，請返回index位置的值。

int pivot = nums[L + (int) (Math.random() * (R - L + 1))];

這一行表示隨機取一個值pivot出來，用這個值做後續的partition操作，如果index恰好在pivot這個值做partition的左右邊界範圍內，則pivot就是排序後第index+1大的數(從1開始算)。

bfprt演算法

brfpt演算法和改進快排演算法主流程上基本一致，只是在選擇pivot的時候有差別，快排改進是隨機取一個數作為pivot, 而bfprt演算法是根據一定的規則取pivot，虛擬碼表示為：

public class LeetCode_0215_KthLargestElementInAnArray {
     
    public static int findKthLargest2(int[] nums, int k) {
        return bfprt(nums, 0, nums.length - 1, k - 1);
    }

    // nums在L...R範圍上，如果要排序（從大到小）的話，請返回index位置的值
    public static int bfprt(int[] nums, int L, int R, int index) {
        if (L == R) {
            return nums[L];
        }
        //int pivot = nums[L + (int) (Math.random() * (R - L + 1))];
        int pivot = medianOfMedians(nums, L, R);
        int[] range = partition(nums, L, R, pivot);
        if (index >= range[0] && index <= range[1]) {
            return pivot;
        } else if (index < range[0]) {
            return bfprt(nums, L, range[0] - 1, index);
        } else {
            return bfprt(nums, range[1] + 1, R, index);
        }
    }
    ....
}

其中

 int pivot = medianOfMedians(nums, L, R);

就是bfprt演算法最關鍵的步驟，mediaOfMedians這個函式表示：

將num分成每五個元素一組，不足一組的補齊一組，並對每組進行排序(由於固定是5個數一組進行排序，所以排序的時間複雜度O(1))，取出每組的中位數，組成一個新的陣列，對新的陣列求其中位數，這個中位數就是我們需要的值pivot。

    public static int medianOfMedians(int[] arr, int L, int R) {
        int size = R - L + 1;
        int offSize = size % 5 == 0 ? 0 : 1;
        int[] mArr = new int[size / 5 + offSize];
        for (int i = 0; i < mArr.length; i++) {
            // 每一組的第一個位置
            int teamFirst = L + i * 5;
            int median = getMedian(arr, teamFirst, Math.min(R, teamFirst + 4));
            mArr[i] = median;
        }
        return bfprt(mArr, 0, mArr.length - 1, (mArr.length - 1) / 2);
    }

    public static int getMedian(int[] arr, int L, int R) {
        Arrays.sort(arr, L, R);
        return arr[(R + L) / 2];
    }

注：mediaOfMedians方法中最後一句：

return bfprt(mArr, 0, mArr.length - 1, (mArr.length - 1) / 2);

就是利用bfprt演算法拿整個元素中間位置的值。

關於bfprt演算法的兩個問題

為什麼是5個一組
為什麼嚴格收斂到O(N)

請參考：

BFPRT演算法原理

BFPTR演算法詳解+實現+複雜度證明

三種解法複雜度分析

演算法	時間	空間
堆	O(N*logK)	O(N)
快排改進	概率上收斂到：O(N)	O(1)
bfprt	嚴格收斂到：O(N)	O(N)

參考資料

找到無序陣列中最小的k個數
2020-12-21
陣列
【遞迴打卡2】求兩個有序陣列的第K小數
2019-03-22
遞迴陣列
找出陣列中第 k 大的數字及其出現次數
2019-03-07
陣列
尋找陣列中第K大的元素
2019-03-01
陣列
查詢陣列中第K大的元素
2023-10-31
陣列
求陣列中k個數的所有組合
2020-09-27
陣列
獲取一個陣列裡面第K大的元素
2019-01-29
陣列
快排思想O(N)求第k大數
2024-11-29
【陣列】1539. 第 k 個缺失的正整數（簡單）
2020-10-24
陣列
陣列中的第K個最大元素
2024-05-28
陣列
最短無序連續子陣列
2020-02-11
陣列
JavaScript如何求陣列的質數
2021-09-11
JavaScript陣列
第三章：查詢與排序（下）----------- 3.9 最快效率求出亂序陣列中第k小的數
2019-03-09
排序陣列
leetcode最短無序連續子陣列
2021-08-03
LeetCode陣列
求陣列內所有偶數的和
2020-12-15
陣列
分支預測：為什麼有序陣列比無序陣列快?
2018-07-10
陣列
215. 陣列中的第K個最大元素
2024-05-09
陣列
【字典序第k小】
2024-09-05
TopK問題，陣列中第K大(小)個元素問題總結
2020-06-19
TopK陣列
LeetCode-215-陣列中的第K個最大元素
2022-04-24
LeetCode陣列
nth_element 找第k大的數
2018-09-25
求區間不同數的個數【樹狀陣列求解】
2018-09-12
陣列
力扣-215. 陣列中的第K個最大元素
2024-06-20
力扣陣列
python實現給定一個數和陣列，求陣列中兩數之和為給定的數
2019-02-19
Python陣列
尋找兩個正序陣列中的中位數
2022-05-29
陣列
求二維陣列中最大子陣列的和
2020-04-07
陣列
和為 K 的子陣列
2024-04-26
陣列
4. 尋找兩個正序陣列的中位數
2020-10-08
陣列
bzoj3110: [Zjoi2013]K大數查詢（主席樹+樹狀陣列）
2018-04-11
陣列
查詢陣列中出現次數大於陣列長度一半的數字
2020-12-15
陣列
JavaScript 陣列順序打亂
2019-02-28
JavaScript陣列
尋找兩個正序陣列的中位數問題，方法一：合併陣列檢索法
2020-12-11
陣列
求陣列平均值
2019-09-21
陣列
第81節：Java中的陣列
2019-02-03
Java陣列
求最小k個數
2020-12-24
給定一個按非遞減順序排序的整數陣列 A，返回每個數字的平方組成的新陣列，要求也按非遞減順序排序。
2020-11-03
排序陣列
給定兩個大小為 m 和 n 的正序（從小到大）陣列 nums1 和 nums2。請你找出並返回這兩個正序陣列的中位數。
2020-10-29
陣列
第 k 大區間
2020-11-26

無序陣列求第K大的數

問題描述

堆解法

改進快排演算法

bfprt演算法

關於bfprt演算法的兩個問題

三種解法複雜度分析

相關題目

LeetCode_0004_MedianOfTwoSortedArrays

第K小的數值對

更多

參考資料

相關文章