資料結構和演算法之——二分查詢下

seniusen發表於2018-10-26

最簡單的二分查詢情況下,我們假設陣列中沒有重複元素,因此很容易實現。如果陣列中存在重複元素,二分查詢就沒有想象中那麼容易了。

1. 查詢第一個值等於給定值的元素?

如果資料中存在相同的元素,但我們要查詢第一個值等於給定值的元素,如果直接用最簡單的二分查詢,顯然是不滿足的。

看下面的例子,有 3 個等於 8 的元素,簡單二分查詢會返回 7,但第一個值等於 8 的元素應該是 a[5]。

其實,只要我們在簡單二分查詢的基礎上再多加上一點限制即可。

當我們發現 a[mid] = val 時,我們需要繼續確認 a[mid] 左邊還有沒有等於 val 的元素。若 mid 左邊沒有和 a[mid] 相等的元素,則此時 a[mid] 就是我們要找的第一個值等於給定值的元素。另外,若 mid 到了第一個元素的位置,說明左邊已經沒有元素,此時 a[mid] 也即是我們要找的元素。否則,我們就需要繼續向左邊查詢。

float Binary_Search(float data[], int left, int right, float value)
{
    int begin = left;
    while (left <= right)
    {
        int mid = left + (right - left) / 2;
        if (value == data[mid])
        {
            if (mid == begin || a[mid - 1] != a[mid]) return mid;
            else right = mid - 1;
        }
        else if (value < data[mid])
        {
            right = mid - 1;
        }
        else
        {
            left = mid + 1;
        }
    }

    return -1;
}

2. 查詢最後一個值等於給定值的元素?

這個問題和上面要查詢第一個值等於給定值的問題思路一樣,只不過是查詢的方向改變了。

當我們發現 a[mid] = val 時,我們需要繼續確認 a[mid] 右邊還有沒有等於 val 的元素。若 mid 右邊沒有和 a[mid] 相等的元素,則此時 a[mid] 就是我們要找的最後一個值等於給定值的元素。另外,若 mid 到達了最後一個元素的位置,說明右邊已經沒有元素,此時 a[mid] 也即是我們要找的元素。否則,我們就需要繼續向右邊查詢。

float Binary_Search(float data[], int left, int right, float value)
{
    int end = right;
    while (left <= right)
    {
        int mid = left + (right - left) / 2;
        if (value == data[mid])
        {
            if (mid == end || a[mid + 1] != a[mid]) return mid;
            else left = mid + 1;
        }
        else if (value < data[mid])
        {
            right = mid - 1;
        }
        else
        {
            left = mid + 1;
        }
    }

    return -1;
}

3. 查詢第一個大於等於給定值的元素?

當我們發現 a[mid] >= val 時,我們需要繼續確認 a[mid] 左邊還有沒有大於等於 val 的元素。若 mid 左邊的值小於 a[mid],則此時 a[mid] 就是我們要找的第一個大於等於給定值的元素。另外,若 mid 到達了第一個元素的位置,說明左邊已經沒有元素,此時 a[mid] 也即是我們要找的元素。否則,我們就需要繼續向左邊查詢。

float Binary_Search(float data[], int left, int right, float value)
{
    int begin = left;
    while (left <= right)
    {
        int mid = left + (right - left) / 2;
        if (data[mid] >= value)
        {
            if (mid == begin || a[mid - 1] < a[mid]) return mid;
            else right = mid - 1;
        }
        else
        {
            left = mid + 1;
        }      
    }

    return -1;
}

4. 查詢最後一個小於等於給定值的元素?

當我們發現 a[mid] <= val 時,我們需要繼續確認 a[mid] 右邊還有沒有小於等於 val 的元素。若 mid 右邊的值大於 a[mid],則此時 a[mid] 就是我們要找的最後一個小於等於給定值的元素。另外,若 mid 到達了最後一個元素的位置,說明右邊已經沒有元素,此時 a[mid] 也即是我們要找的元素。否則,我們就需要繼續向右邊查詢。

float Binary_Search(float data[], int left, int right, float value)
{
    int end = right;
    while (left <= right)
    {
        int mid = left + (right - left) / 2;
        if (data[mid] <= value)
        {
            if (mid == end || a[mid + 1] > a[mid]) return mid;
            else left = mid + 1;
        }
        else
        {
            right = mid - 1;
        }      
    }

    return -1;
}

5. 如何快速定位 IP 對應的省份?

當我們要查詢 202.102.133.13 這個 IP 地址的歸屬地時,我們就在地址庫中搜尋,發現這個 IP 位於 [202.102.133.0, 202.102.133.255] 這個範圍內,我們就可以找到對應的歸屬地——山東東營。

[202.102.133.0, 202.102.133.255]  山東東營市 
[202.102.135.0, 202.102.136.255]  山東煙臺 
[202.102.156.34, 202.102.157.255] 山東青島 
[202.102.48.0, 202.102.48.255] 江蘇宿遷 
[202.102.49.15, 202.102.51.251] 江蘇泰州 
[202.102.56.0, 202.102.56.255] 江蘇連雲港

因此,我們可以按照 IP 地址庫的起始地址對所有區間進行排序,然後問題就轉化為了找到最後一個起始地址小於等於給定 IP 地址的區間

參考資料-極客時間專欄《資料結構與演算法之美》

獲取更多精彩,請關注「seniusen」!

相關文章