二分查詢
1.概念
如果想要在陣列中查詢一個數,最基本的方法就是暴力解法:一次遍歷,這時候時間複雜度是O(N),二分查詢就是其中的一種優化,時間複雜度是O(logN);具體做法是一步一步逼近直到找到。前提是陣列需要是一個排序陣列。
定義:二分查詢也稱折半查詢(Binary Search),是一種在有序陣列中查詢某一特定元素的搜尋演算法。我們可以從定義可知,運用二分搜尋的前提是陣列必須是有序的,這裡需要注意的是,我們的輸入不一定是陣列,也可以是陣列中某一區間的起始位置和終止位置
2.過程
- 1.二分查詢先初始化一個搜尋空間,然後再這個搜尋空間上去尋找某個值,注意這個搜尋空間是有某種規律,比如說是有序的;
- 2.因為這種規律,直接去看中間值,如果判斷中間值和我們想要的結果的關係,比如搜尋數字,看中間值和目標值的大小關係;
- 3.如果mid>t,那證明應該去前半部分搜尋;如果mid<t,那說明該去前半部分搜尋;
- 4.然後接著在新的搜尋空間執行2,3;
關鍵
Knuth 大佬(發明 KMP 演算法的那位)怎麼說的:
Although the basic idea of binary search is comparatively straightforward, the details can be surprisingly tricky...
思路很簡單,細節是魔鬼;
3.模板
//迴圈寫法;
public int binarySearch(int[] nums, int target){
int left = 0, right = num.length-1;
while(left <= right){ //細節1:迴圈條件;
int mid = left + ((right-left) >> 1);
//細節2:防止溢位,此外需要注意由於優先順序的原因,需要新增括號;
if(nums[mid] == target){
return mid;
}else if(nums[mid] < target){
left = mid + 1; //細節3:注意加減1;
}else{
right = mid - 1;
}
}
return -1
}
//遞迴寫法:
public int binarySearch(int[] nums, int target, int left, int right){
if(left <= right){
int mid = left + ((right-left)-1);
if(nums[mid] == target){
return mid; //查詢成功;
}else if(nums[mid] > target){
return binarySearch(nums, target, left, mid-1); //新的區間:左半區間;
}else{
return binarySearch(nums, target, min+1, right); //新的區間: 右半區間;
}
}
return -1;
}
上述功能就是如果能在陣列中找到目標值,就返回其索引,如果找不到,就返回其下標;如果目標值比中間值還大,那肯定在中間值右側(因為陣列已經排序好了),如果目標值比mid值小,那肯定在mid左側。
- 細節1:為什麼while迴圈的條件時<=?
因為我們初始化的時候右側區間是nums.length-1;所以是包括right的,即我們的區間是[left,right],這樣一個左閉右閉的區間,把這個區間理解成搜尋區間,即我們是在這樣一個區間上搜尋,那什麼時候停止呢,兩個原因:- 1.找到了目標值,那就停止;
- 2.沒找到目標值,但是搜尋區間為空了,沒得找了,這時候停止;
所以在最後一個=的時候,比如[2,2]這時候區間還不為空,萬一就是這個2呢。
- 細節2:為什麼寫成left+((right-left) >> 1);
這主要是為了防止溢位,記住就可以了,注意除以2,用位運算的話會比較快一點,而且記得帶外面那個大括號; - 細節3: 為什麼left = mid + 1,right = mid - 1?
想一下剛才搜尋區間的概念,如果發現了索引mid不是要找的target,那自然要從將mid剔除掉,從mid的左邊或者右邊找起來了。
缺陷:上述演算法存在一個缺陷就是不能返回左右側邊界,比如陣列是[1,2,2,2,3], target是2,這時候返回的索引是2,沒有辦法返回左右邊界。
4.樣例
仔細體會上面3個樣例。
- 1.解決了上面說到的不能返回左右邊界的問題;
- 2.這個問題是不完全有序陣列的二分查詢;基本思路就是將其往排序陣列上趕,比較mid和left來確定是前半段有序還是後半段有序;
- 3.是二分查詢的一個問題,並不僅僅是查詢某個值某個元素,重點去感受最後的left=right=mid;體會最後跳出迴圈的返回值;
5.體會
- 當寫成這樣時:返回的left是第一個>=target的值的索引。
- 如果原陣列有target返回的就是第一個target的索引;
- 如果沒有那就是第一個比target大的值的索引(或者可以理解為要將target插入的位置索引);
之所以有上面的結論就在於最後一步一定是left=right=mid,而且mid左側都<t,mid右側都>=t,這時候執行判斷,如果mid大於等於target,那就返回它了,也就是left,如果<target,那就執行left+1,返回的就是第一個>=target的值;
while(left <= right){
int mid = left + ((right-left) >> 1);
if(target <= nums[mid]){ //將等於合併過來;
right = mid-1;
}else{
left = mid+1;
}
}
return left; //第一個比大於等於target的索引;
- 注意檢視上面中提到的二分法的模板和細節,注意什麼時候帶等號,什麼時候不帶等號;
- 二分查詢本質上就是一個不斷縮小搜尋空間的過程,比如我們找出某個值,就是在不斷的把空間縮小;找出哪個數字亂序,也在不斷的把空間縮小;求一個數的開根號,不斷的縮小空間然後拿值去逼近。這個過程要多想一下,就是我們不斷的縮小空間,然後每次都是拿這個空間上的中間值去做某種判斷,然後去逼近我們的結果。
- 二分查詢應用的前提就是一定是一個有序的,或者半有序的,如果是半有序的話原則是就是不斷向有序上去趕,因為只有在有序的時候才能去二分;
- 上面提供的二分查詢的模板要始終明白在最後一步跳出迴圈前兩點:
- 1.最後一步一定是right=left=mid。
- 2.mid左側和右側一定是已經有了規律的了。比如查詢值的時候,mid左側都比t值小,mid右側都比t值大;比如判斷從哪個數字開始亂了,mid左側一定是整齊的,mid右側一定是亂的。那這時候只要去判斷一下mid的值就可以了。如果mid>t或者說mid亂了,那正好返回left也就是mid,如果mid<t或者說mid沒亂,那left=mid+1,這不就正好是第一個大於t或者第一個亂的了嗎。