[LeetCode] Median of Two Sorted Arrays 兩個有序陣列的中位數

Grandyang發表於2015-04-29

There are two sorted arrays nums1 and nums2 of size m and n respectively.

Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

You may assume nums1 and nums2 cannot be both empty.

Example 1:

nums1 = [1, 3]
nums2 = [2]

The median is 2.0

Example 2:

nums1 = [1, 2]
nums2 = [3, 4]

The median is (2 + 3)/2 = 2.5

這道題讓我們求兩個有序陣列的中位數，而且限制了時間複雜度為O(log (m+n))，看到這個時間複雜度，自然而然的想到了應該使用二分查詢法來求解。但是這道題被定義為Hard也是有其原因的，難就難在要在兩個未合併的有序陣列之間使用二分法，如果這道題只有一個有序陣列，讓我們求中位數的話，估計就是個Easy題。那麼我們可以將兩個有序陣列混合起來成為一個有序陣列再做嗎，圖樣圖森破，這個時間複雜度限制的就是告訴你金坷垃別想啦。那麼我們還是要用二分法，而且是在兩個陣列之間使用，感覺很高階啊。那麼回顧一下中位數的定義，如果某個有序陣列長度是奇數，那麼其中位數就是最中間那個，如果是偶數，那麼就是最中間兩個數字的平均值。這裡對於兩個有序陣列也是一樣的，假設兩個有序陣列的長度分別為m和n，由於兩個陣列長度之和 m+n 的奇偶不確定，因此需要分情況來討論，對於奇數的情況，直接找到最中間的數即可，偶數的話需要求最中間兩個數的平均值。為了簡化程式碼，不分情況討論，我們使用一個小trick，我們分別找第 (m+n+1) / 2 個，和 (m+n+2) / 2 個，然後求其平均值即可，這對奇偶數均適用。加入 m+n 為奇數的話，那麼其實 (m+n+1) / 2 和 (m+n+2) / 2 的值相等，相當於兩個相同的數字相加再除以2，還是其本身。

好，這裡我們需要定義一個函式來在兩個有序陣列中找到第K個元素，下面重點來看如何實現找到第K個元素。首先，為了避免產生新的陣列從而增加時間複雜度，我們使用兩個變數i和j分別來標記陣列nums1和nums2的起始位置。然後來處理一些corner cases，比如當某一個陣列的起始位置大於等於其陣列長度時，說明其所有數字均已經被淘汰了，相當於一個空陣列了，那麼實際上就變成了在另一個陣列中找數字，直接就可以找出來了。還有就是如果K=1的話，那麼我們只要比較nums1和nums2的起始位置i和j上的數字就可以了。難點就在於一般的情況怎麼處理？因為我們需要在兩個有序陣列中找到第K個元素，為了加快搜尋的速度，我們要使用二分法，那麼對誰二分呢，陣列麼？其實要對K二分，意思是我們需要分別在nums1和nums2中查詢第K/2個元素，注意這裡由於兩個陣列的長度不定，所以有可能某個陣列沒有第K/2個數字，所以我們需要先check一下，陣列中到底存不存在第K/2個數字，如果存在就取出來，否則就賦值上一個整型最大值。如果某個陣列沒有第K/2個數字，那麼我們就淘汰另一個陣列的前K/2個數字即可。舉個例子來說吧，比如 nums1 = {3}，nums2 = {2, 4, 5, 6, 7}，K=4，我們要找兩個陣列混合中第4個數字，那麼我們分別在 nums1 和 nums2 中找第2個數字，我們發現 nums1 中只有一個數字，不存在第二個數字，那麼 nums2 中的前2個數字可以直接跳過，為啥呢，因為我們要求整個混合陣列的第4個數字，不管 nums1 中的那個數字是大是小，第4個數字絕不會出現在 nums2 的前兩個數字中，所以可以直接跳過。

有沒有可能兩個陣列都不存在第K/2個數字呢，這道題裡是不可能的，因為我們的K不是任意給的，而是給的m+n的中間值，所以必定至少會有一個陣列是存在第K/2個數字的。最後就是二分法的核心啦，比較這兩個陣列的第K/2小的數字midVal1和midVal2的大小，如果第一個陣列的第K/2個數字小的話，那麼說明我們要找的數字肯定不在nums1中的前K/2個數字，所以我們可以將其淘汰，將nums1的起始位置向後移動K/2個，並且此時的K也自減去K/2，呼叫遞迴。反之，我們淘汰nums2中的前K/2個數字，並將nums2的起始位置向後移動K/2個，並且此時的K也自減去K/2，呼叫遞迴即可，參見程式碼如下：

C++ 解法一：

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size(), left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(vector<int>& nums1, int i, vector<int>& nums2, int j, int k) {
        if (i >= nums1.size()) return nums2[j + k - 1];
        if (j >= nums2.size()) return nums1[i + k - 1];
        if (k == 1) return min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.size()) ? nums1[i + k / 2 - 1] : INT_MAX;
        int midVal2 = (j + k / 2 - 1 < nums2.size()) ? nums2[j + k / 2 - 1] : INT_MAX;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
};

Java 解法一：

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, 0, nums2, 0, left) + findKth(nums1, 0, nums2, 0, right)) / 2.0;
    }
    int findKth(int[] nums1, int i, int[] nums2, int j, int k) {
        if (i >= nums1.length) return nums2[j + k - 1];
        if (j >= nums2.length) return nums1[i + k - 1];
        if (k == 1) return Math.min(nums1[i], nums2[j]);
        int midVal1 = (i + k / 2 - 1 < nums1.length) ? nums1[i + k / 2 - 1] : Integer.MAX_VALUE;
        int midVal2 = (j + k / 2 - 1 < nums2.length) ? nums2[j + k / 2 - 1] : Integer.MAX_VALUE;
        if (midVal1 < midVal2) {
            return findKth(nums1, i + k / 2, nums2, j, k - k / 2);
        } else {
            return findKth(nums1, i, nums2, j + k / 2, k - k / 2);
        }
    }
}

上面的解法一直使用的是原陣列，同時用了兩個變數來分別標記當前的起始位置。我們也可以直接生成新的陣列，這樣就不要用起始位置變數了，不過拷貝陣列的操作可能會增加時間複雜度，也許會超出限制，不過就算當個思路擴充也是極好的。首先我們要判斷陣列是否為空，為空的話，直接在另一個陣列找第K個即可。還有一種情況是當K = 1時，表示我們要找第一個元素，只要比較兩個陣列的第一個元素，返回較小的那個即可。這裡我們分別取出兩個陣列的第K/2個數字的位置座標i和j，為了避免陣列沒有第K/2個陣列的情況，我們每次都和陣列長度做比較，取出較小值。這裡跟上面的解法有些許不同，上面解法我們直接取出的是值，而這裡我們取出的是位置座標，但是思想都是很類似的。不同在於，上面解法中我們每次固定淘汰K/2個數字，而這裡我們由於取出了合法的i和j，所以我們每次淘汰i或j個。評論區有網友提出，可以讓 j = k-i，這樣也是對的，可能還更好一些，收斂速度可能會更快一些，參見程式碼如下：

C++ 解法二：

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        return (findKth(nums1, nums2, (m + n + 1) / 2) + findKth(nums1, nums2, (m + n + 2) / 2)) / 2.0;
    }
    int findKth(vector<int> nums1, vector<int> nums2, int k) {
        if (nums1.empty()) return nums2[k - 1];
        if (nums2.empty()) return nums1[k - 1];
        if (k == 1) return min(nums1[0], nums2[0]);
        int i = min((int)nums1.size(), k / 2), j = min((int)nums2.size(), k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, vector<int>(nums2.begin() + j, nums2.end()), k - j);
        } else {
            return findKth(vector<int>(nums1.begin() + i, nums1.end()), nums2, k - i);
        }
        return 0;
    }
};

Java 解法二：

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length, left = (m + n + 1) / 2, right = (m + n + 2) / 2;
        return (findKth(nums1, nums2, left) + findKth(nums1, nums2, right)) / 2.0;
    }
    int findKth(int[] nums1, int[] nums2, int k) {
        int m = nums1.length, n = nums2.length;
        if (m == 0) return nums2[k - 1];
        if (n == 0) return nums1[k - 1];
        if (k == 1) return Math.min(nums1[0], nums2[0]);
        int i = Math.min(m, k / 2), j = Math.min(n, k / 2);
        if (nums1[i - 1] > nums2[j - 1]) {
            return findKth(nums1, Arrays.copyOfRange(nums2, j, n), k - j);
        } else {
            return findKth(Arrays.copyOfRange(nums1, i, m), nums2, k - i);
        }
    }
}

此題還能用迭代形式的二分搜尋法來解，是一種相當巧妙的應用，講解在這個帖子中寫的十分清楚，等有時間我再來寫寫分析過程：

C++ 解法三：

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return ((double)nums1[(m - 1) / 2] + (double)nums1[m / 2]) / 2.0;
        int left = 0, right = n * 2;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? INT_MIN : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? INT_MIN : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? INT_MAX : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? INT_MAX : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (max(L1, L2) + min(R1, R2)) / 2;
        }
        return -1;
    }
};

Java 解法三：

public class Solution {
    public double findMedianSortedArrays(int[] nums1, int[] nums2) {
        int m = nums1.length, n = nums2.length;
        if (m < n) return findMedianSortedArrays(nums2, nums1);
        if (n == 0) return (nums1[(m - 1) / 2] + nums1[m / 2]) / 2.0;
        int left = 0, right = 2 * n;
        while (left <= right) {
            int mid2 = (left + right) / 2;
            int mid1 = m + n - mid2;
            double L1 = mid1 == 0 ? Double.MIN_VALUE : nums1[(mid1 - 1) / 2];
            double L2 = mid2 == 0 ? Double.MIN_VALUE : nums2[(mid2 - 1) / 2];
            double R1 = mid1 == m * 2 ? Double.MAX_VALUE : nums1[mid1 / 2];
            double R2 = mid2 == n * 2 ? Double.MAX_VALUE : nums2[mid2 / 2];
            if (L1 > R2) left = mid2 + 1;
            else if (L2 > R1) right = mid2 - 1;
            else return (Math.max(L1, L2) + Math.min(R1, R2)) / 2;
        }
        return -1;
    }
}

參考資料：

https://leetcode.com/problems/median-of-two-sorted-arrays/

https://leetcode.com/problems/median-of-two-sorted-arrays/discuss/2496/Concise-JAVA-solution-based-on-Binary-Search

https://leetcode.com/problems/median-of-two-sorted-arrays/discuss/2499/Share-my-simple-O(log(m%2Bn))-solution-for-your-reference

https://leetcode.com/problems/median-of-two-sorted-arrays/discuss/2471/Very-concise-O(log(min(MN)))-iterative-solution-with-detailed-explanation

LeetCode All in One 題目講解彙總(持續更新中...)

leetcode 4. Median of Two Sorted Arrays 尋找兩個正序陣列的中位數(困難)
2022-05-30
LeetCode陣列
Leetcode 4 Median of Two Sorted Arrays
2019-02-13
LeetCode
LeetCode 4. Median of Two Sorted Arrays
2018-08-14
LeetCode
LeetCode Median of Two Sorted Arrays（004）解法總結
2020-03-11
LeetCode
兩個有序陣列的中位數
2018-05-09
陣列
LeetCode--尋找兩個有序陣列的中位數（05）
2020-10-17
LeetCode陣列
LeetCode第4題：尋找兩個有序陣列的中位數
2020-07-12
LeetCode陣列
尋找兩個有序陣列的中位數
2019-05-14
陣列
[LeetCode 刷題] 4. 尋找兩個有序陣列的中位數 (Hard)
2020-01-09
LeetCode陣列
LeetCode-兩個排序陣列的中位數
2018-05-24
LeetCode排序陣列
LeetCode解題(C++)-4. 尋找兩個有序陣列的中位數
2019-02-22
LeetCodeC++陣列
LeetCode 4. 兩個排序陣列的中位數
2018-07-06
LeetCode排序陣列
LeetCode-4. 兩個排序陣列的中位數
2018-05-01
LeetCode排序陣列
【LeetCode】88. 合併兩個有序陣列
2021-08-22
LeetCode陣列
將兩個有序陣列合併為一個有序陣列
2018-11-25
陣列
兩個有序陣列如何合併成一個有序陣列
2019-03-15
陣列
LeetCode合併兩個有序陣列（逆向雙指標）
2024-04-04
LeetCode陣列指標
4. 兩個排序陣列的中位數
2018-04-06
排序陣列
【LeetCode Hot 100】4. 尋找兩個正序陣列的中位數
2024-09-19
LeetCode陣列
GO實現：leetcode之尋找兩個正序陣列的中位數
2020-11-27
GoLeetCode陣列
合併兩個有序陣列
2020-12-12
陣列
LeetCode每日一題:合併兩個有序陣列（No.88）
2019-03-26
LeetCode每日一題陣列
每日一道 LeetCode (19)：合併兩個有序陣列
2020-08-16
LeetCode陣列
LeetCode題集-4 - 尋找兩個有序陣列的中位數，圖文並茂，六種解法，萬字講解
2024-09-16
LeetCode陣列
尋找兩個正序陣列中的中位數
2022-05-29
陣列
演算法-兩個排序陣列的中位數
2018-07-07
演算法排序陣列
[Python手撕]兩個升序陣列的中位數
2024-09-06
Python陣列
從0打卡leetcode之day 5 ---兩個排序陣列的中位數
2018-08-18
LeetCode排序陣列
LeetCode | 349 Intersection Of Two Arrays
2024-08-09
LeetCode
88、合併兩個有序陣列
2018-07-07
陣列
【leetcode 簡單】第二十題合併兩個有序陣列
2018-08-13
LeetCode陣列
【leetcode】26. Remove Duplicates from Sorted Array 刪除有序陣列的重複元素
2019-05-11
LeetCodeREM陣列
88. 合併兩個有序陣列
2024-06-07
陣列
4. 尋找兩個正序陣列的中位數
2020-10-08
陣列
Leetcode 21 Merge Two Sorted Lists
2018-10-17
LeetCode
LeetCode-977.有序陣列的平方
2020-10-16
LeetCode陣列
Fourth. LeetCode 21:MergeTwo Sorted Lists 合併兩個有序連結串列
2020-11-28
LeetCode
【遞迴打卡2】求兩個有序陣列的第K小數
2019-03-22
遞迴陣列
LeetCode: Two sum(兩數之和)
2019-01-08
LeetCode

[LeetCode] Median of Two Sorted Arrays 兩個有序陣列的中位數

相關文章