【演算法】二分查詢

Curryxin發表於2021-08-05

二分查詢

1.概念

如果想要在陣列中查詢一個數,最基本的方法就是暴力解法:一次遍歷,這時候時間複雜度是O(N),二分查詢就是其中的一種優化,時間複雜度是O(logN);具體做法是一步一步逼近直到找到。前提是陣列需要是一個排序陣列

定義:二分查詢也稱折半查詢(Binary Search),是一種在有序陣列中查詢某一特定元素的搜尋演算法。我們可以從定義可知,運用二分搜尋的前提是陣列必須是有序的,這裡需要注意的是,我們的輸入不一定是陣列,也可以是陣列中某一區間的起始位置和終止位置

2.過程

  • 1.二分查詢先初始化一個搜尋空間,然後再這個搜尋空間上去尋找某個值,注意這個搜尋空間是有某種規律,比如說是有序的;
  • 2.因為這種規律,直接去看中間值,如果判斷中間值和我們想要的結果的關係,比如搜尋數字,看中間值和目標值的大小關係;
  • 3.如果mid>t,那證明應該去前半部分搜尋;如果mid<t,那說明該去前半部分搜尋;
  • 4.然後接著在新的搜尋空間執行2,3;

關鍵
Knuth 大佬(發明 KMP 演算法的那位)怎麼說的:
Although the basic idea of binary search is comparatively straightforward, the details can be surprisingly tricky...
思路很簡單,細節是魔鬼

3.模板

//迴圈寫法;
public int binarySearch(int[] nums, int target){
    int left = 0, right = num.length-1;
    while(left <= right){  //細節1:迴圈條件;
        int mid = left + ((right-left) >> 1);  
        //細節2:防止溢位,此外需要注意由於優先順序的原因,需要新增括號;
        if(nums[mid] == target){
            return mid;
        }else if(nums[mid] < target){
            left = mid + 1; //細節3:注意加減1;
        }else{
            right = mid - 1;
        }
    }
    return -1
}

//遞迴寫法:
public int binarySearch(int[] nums, int target, int left, int right){
    if(left <= right){
        int mid = left + ((right-left)-1);
        if(nums[mid] == target){
            return mid;  //查詢成功;
        }else if(nums[mid] > target){
            return binarySearch(nums, target, left, mid-1); //新的區間:左半區間;
        }else{
            return binarySearch(nums, target, min+1, right); //新的區間: 右半區間;
        }
    }
    return -1;
}

上述功能就是如果能在陣列中找到目標值,就返回其索引,如果找不到,就返回其下標;如果目標值比中間值還大,那肯定在中間值右側(因為陣列已經排序好了),如果目標值比mid值小,那肯定在mid左側。

  • 細節1:為什麼while迴圈的條件時<=?
    因為我們初始化的時候右側區間是nums.length-1;所以是包括right的,即我們的區間是[left,right],這樣一個左閉右閉的區間,把這個區間理解成搜尋區間,即我們是在這樣一個區間上搜尋,那什麼時候停止呢,兩個原因:
    • 1.找到了目標值,那就停止;
    • 2.沒找到目標值,但是搜尋區間為空了,沒得找了,這時候停止;
      所以在最後一個=的時候,比如[2,2]這時候區間還不為空,萬一就是這個2呢。
  • 細節2:為什麼寫成left+((right-left) >> 1);
    這主要是為了防止溢位,記住就可以了,注意除以2,用位運算的話會比較快一點,而且記得帶外面那個大括號;
  • 細節3: 為什麼left = mid + 1,right = mid - 1?
    想一下剛才搜尋區間的概念,如果發現了索引mid不是要找的target,那自然要從將mid剔除掉,從mid的左邊或者右邊找起來了。

缺陷:上述演算法存在一個缺陷就是不能返回左右側邊界,比如陣列是[1,2,2,2,3], target是2,這時候返回的索引是2,沒有辦法返回左右邊界。

4.樣例

34. 在排序陣列中查詢元素的第一個和最後一個位置

33. 搜尋旋轉排序陣列

劍指 Offer 53 - II. 0~n-1中缺失的數字

仔細體會上面3個樣例。

  • 1.解決了上面說到的不能返回左右邊界的問題;
  • 2.這個問題是不完全有序陣列的二分查詢;基本思路就是將其往排序陣列上趕,比較mid和left來確定是前半段有序還是後半段有序;
  • 3.是二分查詢的一個問題,並不僅僅是查詢某個值某個元素,重點去感受最後的left=right=mid;體會最後跳出迴圈的返回值;

5.體會

  • 當寫成這樣時:返回的left是第一個>=target的值的索引。
    • 如果原陣列有target返回的就是第一個target的索引;
    • 如果沒有那就是第一個比target大的值的索引(或者可以理解為要將target插入的位置索引);

之所以有上面的結論就在於最後一步一定是left=right=mid,而且mid左側都<t,mid右側都>=t,這時候執行判斷,如果mid大於等於target,那就返回它了,也就是left,如果<target,那就執行left+1,返回的就是第一個>=target的值;

while(left <= right){
    int mid = left + ((right-left) >> 1);
    if(target <= nums[mid]){ //將等於合併過來;
        right = mid-1;
    }else{
        left = mid+1;
    }
}
    return left; //第一個比大於等於target的索引;
  • 注意檢視上面中提到的二分法的模板和細節,注意什麼時候帶等號,什麼時候不帶等號;
  • 二分查詢本質上就是一個不斷縮小搜尋空間的過程,比如我們找出某個值,就是在不斷的把空間縮小;找出哪個數字亂序,也在不斷的把空間縮小;求一個數的開根號,不斷的縮小空間然後拿值去逼近。這個過程要多想一下,就是我們不斷的縮小空間,然後每次都是拿這個空間上的中間值去做某種判斷,然後去逼近我們的結果
  • 二分查詢應用的前提就是一定是一個有序的,或者半有序的,如果是半有序的話原則是就是不斷向有序上去趕,因為只有在有序的時候才能去二分;
  • 上面提供的二分查詢的模板要始終明白在最後一步跳出迴圈前兩點:
    • 1.最後一步一定是right=left=mid。
    • 2.mid左側和右側一定是已經有了規律的了。比如查詢值的時候,mid左側都比t值小,mid右側都比t值大;比如判斷從哪個數字開始亂了,mid左側一定是整齊的,mid右側一定是亂的。那這時候只要去判斷一下mid的值就可以了。如果mid>t或者說mid亂了,那正好返回left也就是mid,如果mid<t或者說mid沒亂,那left=mid+1,這不就正好是第一個大於t或者第一個亂的了嗎。

相關文章