【五大常用演算法】一文搞懂分治演算法

bigsai發表於2021-01-12

前言

分治演算法(divide and conquer)是五大常用演算法(分治演算法、動態規劃演算法、貪心演算法、回溯法、分治界限法)之一,很多人在平時學習中可能只是知道分治演算法,但是可能並沒有系統的學習分治演算法,本篇就帶你較為全面的去認識和了解分治演算法。

在學習分治演算法之前,問你一個問題,相信大家小時候都有存錢罐的經歷,父母親人如果給錢都會往自己的寶藏中存錢,我們每隔一段時間都會清點清點錢。但是一堆錢讓你處理起來你可能覺得很複雜,因為資料相對於大腦有點龐大了,並且很容易算錯,你可能會將它先分成幾個小份算,然後再疊加起來計算總和就獲得這堆錢的總數了

image-20201130124009617

當然如果你覺得各個部分錢數量還是太大,你依然可以進行劃分然後合併,我們之所以這麼多是因為:

  • 計算每個小堆錢的方式和計算最大堆錢的方式是相同的(區別在於體量上)
  • 然後大堆錢總和其實就是小堆錢結果之和。這樣其實就有一種分治的思想。

當然這些錢都是想出來的……

BACDB95DF648E67CF0576A009697EBD2

分治演算法介紹

分治演算法是用了分治思想的一種演算法,什麼是分治

分治,字面上的解釋是“分而治之”,就是把一個複雜的問題分成兩個或更多的相同或相似的子問題,再把子問題分成更小的子問題……直到最後子問題可以簡單的直接求解,原問題的解即子問題的解的合併。在電腦科學中,分治法就是運用分治思想的一種很重要的演算法。分治法是很多高效演算法的基礎,如排序演算法(快速排序,歸併排序),傅立葉變換(快速傅立葉變換)等等。

將父問題分解為子問題同等方式求解,這和遞迴的概念很吻合,所以在分治演算法通常以遞迴的方式實現(當然也有非遞迴的實現方式)。分治演算法的描述從字面上也很容易理解,分、治其實還有個合併的過程:

  • 分(Divide):遞迴解決較小的問題(到終止層或者可以解決的時候停下)
  • 治(Conquer):遞迴求解,如果問題夠小直接求解。
  • 合併(Combine):將子問題的解構建父類問題

一般分治演算法在正文中分解為兩個即以上的遞迴呼叫,並且子類問題一般是不想交的(互不影響)。當求解一個問題規模很大很難直接求解,但是規模較小的時候問題很容易求解並且這個問題並且問題滿足分治演算法的適用條件,那麼就可以使用分治演算法。

image-20201130165303362

那麼採用分治演算法解決的問題需要 滿足那些條件(特徵) 呢?

1 . 原問題規模通常比較大,不易直接解決,但問題縮小到一定程度就能較容易的解決。

2 . 問題可以分解為若干規模較小、求解方式相同(似)的子問題。且子問題之間求解是獨立的互不影響。

3 . 合併問題分解的子問題可以得到問題的解。

你可能會疑惑分治演算法和遞迴有什麼關係?其實分治重要的是一種思想,注重的是問題分、治、合併的過程。而遞迴是一種方式(工具),這種方式通過方法自己呼叫自己形成一個來回的過程,而分治可能就是利用了多次這樣的來回過程。

分治演算法經典問題

對於分治演算法的經典問題,重要的是其思想,因為我們大部分藉助遞迴去實現,所以在程式碼實現上大部分都是很簡單,而本篇也重在講述思想。

分治演算法的經典問題,個人將它分成兩大類:子問題完全獨立和子問題不完全獨立。

1 . 子問題完全獨立就是原問題的答案可完全由子問題的結果推出。

2 . 子問題不完全獨立,有些區間類的問題或者跨區間問題使用分治可能結果跨區間,在考慮問題的時候需要仔細借鑑下。

二分搜尋

二分搜尋是分治的一個例項,只不過二分搜尋有著自己的特殊性

  • 序列有序
  • 結果為一個值

正常二分將一個完整的區間分成兩個區間,兩個區間本應單獨找值然後確認結果,但是通過有序的區間可以直接確定結果在那個區間,所以分的兩個區間只需要計算其中一個區間,然後繼續進行一直到結束。實現方式有遞迴和非遞迴,但是非遞迴用的更多一些:

public int searchInsert(int[] nums, int target) {
  if(nums[0]>=target)return 0;//剪枝
  if(nums[nums.length-1]==target)return nums.length-1;//剪枝
  if(nums[nums.length-1]<target)return nums.length;
  int left=0,right=nums.length-1;
  while (left<right) {
    int mid=(left+right)/2;
    if(nums[mid]==target)
      return mid;
    else if (nums[mid]>target) {
      right=mid;
    }
    else {
      left=mid+1;
    }
  }
  return left;
}

快速排序

快排也是分治的一個例項,快排每一趟會選定一個數,將比這個數小的放左面,比這個數大的放右面,然後遞迴分治求解兩個子區間,當然快排因為在分的時候就做了很多工作,當全部分到最底層的時候這個序列的值就是排序完的值。這是一種分而治之的體現。

image-20201120133851275

public void quicksort(int [] a,int left,int right)
{
  int low=left;
  int high=right;
  //下面兩句的順序一定不能混,否則會產生陣列越界!!!very important!!!
  if(low>high)//作為判斷是否截止條件
    return;
  int k=a[low];//額外空間k,取最左側的一個作為衡量,最後要求左側都比它小,右側都比它大。
  while(low<high)//這一輪要求把左側小於a[low],右側大於a[low]。
  {
    while(low<high&&a[high]>=k)//右側找到第一個小於k的停止
    {
      high--;
    }
    //這樣就找到第一個比它小的了
    a[low]=a[high];//放到low位置
    while(low<high&&a[low]<=k)//在low往右找到第一個大於k的,放到右側a[high]位置
    {
      low++;
    }
    a[high]=a[low];            
  }
  a[low]=k;//賦值然後左右遞迴分治求之
  quicksort(a, left, low-1);
  quicksort(a, low+1, right);        
}

歸併排序(逆序數)

快排在分的時候做了很多工作,而歸併就是相反,歸併在分的時候按照數量均勻分,而合併時候已經是兩兩有序的進行合併的,因為兩個有序序列O(n)級別的複雜度即可得到需要的結果。而逆序數在歸併排序基礎上變形同樣也是分治思想求解。

image-20201120173153449

private static void mergesort(int[] array, int left, int right) {
  int mid=(left+right)/2;
  if(left<right)
  {
    mergesort(array, left, mid);
    mergesort(array, mid+1, right);
    merge(array, left,mid, right);
  }
}

private static void merge(int[] array, int l, int mid, int r) {
  int lindex=l;int rindex=mid+1;
  int team[]=new int[r-l+1];
  int teamindex=0;
  while (lindex<=mid&&rindex<=r) {//先左右比較合併
    if(array[lindex]<=array[rindex])
    {
      team[teamindex++]=array[lindex++];
    }
    else {                
      team[teamindex++]=array[rindex++];
    }
  }
  while(lindex<=mid)//當一個越界後剩餘按序列新增即可
  {
    team[teamindex++]=array[lindex++];

  }
  while(rindex<=r)
  {
    team[teamindex++]=array[rindex++];
  }    
  for(int i=0;i<teamindex;i++)
  {
    array[l+i]=team[i];
  }
}

最大子序列和

最大子序列和的問題我們可以使用動態規劃的解法,但是也可以使用分治演算法來解決問題,但是最大子序列和在合併的時候並不是簡單的合併,因為子序列和涉及到一個長度的問題,所以正確結果不一定全在最左側或者最右側,而可能出現結果的區域為:

  • 完全在中間的左側
  • 完全在中間的右側
  • 包含中間左右兩個節點的一個序列

用一張圖可以表示為:

在這裡插入圖片描述

所以在具體考慮的時候需要將無法遞迴得到結果的中間那個最大值串的結果也算出來參與左側、右側值得比較。

力扣53. 最大子序和在實現的程式碼為:

public int maxSubArray(int[] nums) {
    int max=maxsub(nums,0,nums.length-1);
    return max;
}
int maxsub(int nums[],int left,int right)
{
    if(left==right)
        return  nums[left];
    int mid=(left+right)/2;
    int leftmax=maxsub(nums,left,mid);//左側最大
    int rightmax=maxsub(nums,mid+1,right);//右側最大

    int midleft=nums[mid];//中間往左
    int midright=nums[mid+1];//中間往右
    int team=0;
    for(int i=mid;i>=left;i--)
    {
        team+=nums[i];
        if(team>midleft)
            midleft=team;
    }
    team=0;
    for(int i=mid+1;i<=right;i++)
    {
        team+=nums[i];
        if(team>midright)
            midright=team;
    }
    int max=midleft+midright;//中間的最大值
    if(max<leftmax)
        max=leftmax;
    if(max<rightmax)
        max=rightmax;
    return  max;
}

最近點對

最近點對是一個分治非常成功的運用之一。在二維座標軸上有若干個點座標,讓你求出最近的兩個點的距離,如果讓你直接求那麼列舉暴力是個非常非常大的計算量,我們通常採用分治的方法來優化這種問題。

image-20201130204401673

如果直接分成兩部分分治計算你肯定會發現如果最短的如果一個在左一個在右會出現問題。我們可以優化一下。

在具體的優化方案上,按照x或者y的維度進行考慮,將資料分成兩個區域,先分別計算(按照同方法)左右區域內最短的點對。然後根據這個兩個中較短的距離向左和向右覆蓋,計算被覆蓋的左右點之間的距離,找到最小那個距離與當前最短距離比較即可。

image-20201130205950625

這樣你就可以發現就這個一次的操作(不考慮子情況),左側紅點就避免和右側大部分紅點進行距離計算(O(n2)的時間複雜度)。事實上,在進行左右區間內部計算的時候,它其實也這樣遞迴的進行很多次分治計算。如圖所示:

image-20201130210925059

這樣下去就可以節省很多次的計算量。

但是這種分治會存在一種問題就是二維座標可能點都聚集某個方法某條軸那麼可能效果並不明顯(點都在x=2附近對x分割作用就不大),需要注意一下。

杭電1007推薦給大家,ac的程式碼為:

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.io.StreamTokenizer;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Comparator;
import java.util.List;
public class Main {
    static int n;
    public static void main(String[] args) throws IOException {
        StreamTokenizer in=new StreamTokenizer(new BufferedReader(new InputStreamReader(System.in)));
        PrintWriter out = new PrintWriter(new OutputStreamWriter(System.out));
        //List<node>list=new ArrayList();
         while(in.nextToken()!=StreamTokenizer.TT_EOF)
         {
             n=(int)in.nval;if(n==0) {break;}
            node no[]=new node[n];
            
             for(int i=0;i<n;i++)
             {
                 in.nextToken();double x=in.nval;
                 in.nextToken();double y=in.nval;
                // list.add(new node(x,y));
                 no[i]=new node(x,y);
             }
             Arrays.sort(no, com);
            double min= search(no,0,n-1);
            out.println(String.format("%.2f", Math.sqrt(min)/2));out.flush();
         }         
    }
    private static double search(node[] no, int left,int right) {
        int mid=(right+left)/2;
        double minleng=0;
        if(left==right) {return Double.MAX_VALUE;}
        else if(left+1==right) {minleng= (no[left].x-no[right].x)*(no[left].x-no[right].x)+(no[left].y-no[right].y)*(no[left].y-no[right].y);}
        else minleng= min(search(no,left,mid),search(no,mid,right));
        int ll=mid;int rr=mid+1;
        while(no[mid].y-no[ll].y<=Math.sqrt(minleng)/2&&ll-1>=left) {ll--;}
        while(no[rr].y-no[mid].y<=Math.sqrt(minleng)/2&&rr+1<=right) {rr++;}
        for(int i=ll;i<rr;i++)
        {
            for(int j=i+1;j<rr+1;j++)
            {
                double team=0;
                if(Math.abs((no[i].x-no[j].x)*(no[i].x-no[j].x))>minleng) {continue;}
                else
                { 
                    team=(no[i].x-no[j].x)*(no[i].x-no[j].x)+(no[i].y-no[j].y)*(no[i].y-no[j].y);
                    if(team<minleng)minleng=team;
                }
            }
        }
        return minleng;
    
    }
    private static double min(double a, double b) {
        // TODO 自動生成的方法存根
        return a<b?a:b;
    }
    static Comparator<node>com=new Comparator<node>() {

        @Override
        public int compare(node a1, node a2) {
            // TODO 自動生成的方法存根
            return a1.y-a2.y>0?1:-1;
        }};
    static class node
    {
        double x;
        double y;
        public node(double x,double y)
        {
            this.x=x;
            this.y=y;
        }
    }
}

結語

到這裡,分治演算法就講這麼多了,因為分治演算法重要在於理解其思想,還有一些典型的分治演算法解決的問題,例如大整數乘法、Strassen矩陣乘法、棋盤覆蓋、線性時間選擇、迴圈賽日程表、漢諾塔等問題你可以自己研究其分治的思想和原理。

原創公眾號:bigsai
文章收錄在 bigsai-algorithm

原創不易,bigsai請你幫兩件事幫忙一下:

  1. 點贊在看, 您的肯定是我在思否創作的源源動力。
  2. 微信搜尋「bigsai」,新人求關注~

相關文章