十、深度優先 && 廣度優先

abc十號發表於2020-06-26

原文地址

一、什麼是“搜尋”演算法?

  • 演算法是作用於具體資料結構之上的,深度優先搜尋演算法和廣度優先搜尋演算法都是基於“圖”這種資料結構的。
  • 因為圖這種資料結構的表達能力很強,大部分涉及搜尋的場景都可以抽象成“圖”。
  • 圖上的搜尋演算法,最直接的理解就是,在圖中找出從一個頂點出發,到另一個頂點的路徑。
  • 具體方法有很多,兩種最簡單、最“暴力”的方法為深度優先、廣度優先搜尋,還有A、 IDA等啟發式搜尋演算法。
  • 圖有兩種主要儲存方法,鄰接表和鄰接矩陣。
  • 以無向圖,採用鄰接表儲存為例:
public class Graph {
    // 頂點的個數
    private int v;
    // 每個頂點後面有個連結串列
    private LinkedList<Integer>[] adj;

    public Graph(int v) {
        this.v = v;
        adj = new LinkedList[v];
        for (int i = 0; i < v; i++) {
            adj[i] = new LinkedList<>();
        }
    }

    /**
     * 新增邊
     * @param s 頂點
     * @param t 頂點
     */
    public void addEdge(int s,int t){
        // 無向圖一條邊存兩次(聯想微信好友)
        adj[s].add(t);
        adj[t].add(s);
    }
}

二、廣度優先搜尋(BFS)

  • 廣度優先搜尋(Breadth-First-Search),簡稱為 BFS。
  • 它是一種“地毯式”層層推進的搜尋策略,即先查詢離起始頂點最近的,然後是次近的,依次往外搜尋
  • BFS

2.1、實現過程

/**
 * 圖的廣度優先搜尋,搜尋一條從 s 到 t 的路徑。
 * 這樣求得的路徑就是從 s 到 t 的最短路徑。
 *
 * @param s 起始頂點
 * @param t 終止頂點
 */
public void bfs(int s, int t) {
    if (s == t) {
        return;
    }
    // visited 記錄已經被訪問的頂點,避免頂點被重複訪問。如果頂點 q 被訪問,那相應的visited[q]會被設定為true。
    boolean[] visited = new boolean[v];
    visited[s] = true;
    // queue 是一個佇列,用來儲存已經被訪問、但相連的頂點還沒有被訪問的頂點。因為廣度優先搜尋是逐層訪問的,只有把第k層的頂點都訪問完成之後,才能訪問第k+1層的頂點。
    // 當訪問到第k層的頂點的時候,需要把第k層的頂點記錄下來,稍後才能通過第k層的頂點來找第k+1層的頂點。
    // 所以,用這個佇列來實現記錄的功能。
    Queue<Integer> queue = new LinkedList<>();
    queue.add(s);
    // prev 用來記錄搜尋路徑。當從頂點s開始,廣度優先搜尋到頂點t後,prev陣列中儲存的就是搜尋的路徑。
    // 不過,這個路徑是反向儲存的。prev[w]儲存的是,頂點w是從哪個前驅頂點遍歷過來的。
    // 比如,通過頂點2的鄰接表訪問到頂點3,那prev[3]就等於2。為了正向列印出路徑,需要遞迴地來列印,就是print()函式的實現方式。
    int[] prev = Arrays.stream(new int[v]).map(f -> -1).toArray();

    while (queue.size() != 0) {
        int w = queue.poll();
        LinkedList<Integer> wLinked = adj[w]; // 表示:鄰接表儲存時頂點為w,所對應的連結串列
        for (int i = 0; i < wLinked.size(); ++i) {
            int q = wLinked.get(i);
            // 判斷頂點 q 是否被訪問
            if (!visited[q]) {
                // 未被訪問
                prev[q] = w;
                if (q == t) {
                    print(prev, s, t);
                    return;
                }
                visited[q] = true;
                queue.add(q);
            }
        }
    }
}

// 遞迴列印s->t的路徑
private void print(int[] prev, int s, int t) {
    if (prev[t] != -1 && t != s) {
        print(prev, s, prev[t]);
    }
    System.out.print(t + " ");
}

原理如下:

2.2、複雜度分析

  • 最壞情況下,終止頂點 t 離起始頂點 s 很遠,需要遍歷完整個圖才能找到。
  • 這個時候,每個頂點都要進出一遍佇列,每個邊也都會被訪問一次,所以,廣度優先搜尋的時間複雜度是 O(V+E)
  • 其中,V 表示頂點的個數,E 表示邊的個數。
  • 對於一個連通圖來說,也就是說一個圖中的所有頂點都是連通的,E肯定要大於等於 V-1,所以,廣度優先搜尋的時間複雜度也可以簡寫為 O(E)。
  • 廣度優先搜尋的空間消耗主要在幾個輔助變數 visited 陣列、queue 佇列、prev 陣列上。
  • 這三個儲存空間的大小都不會超過頂點的個數,所以空間複雜度是 O(V)

三、深度優先搜尋(DFS)

  • 深度優先搜尋(Depth-First-Search),簡稱DFS。
  • 最直觀的例子就是“走迷宮,假設站在迷宮的某個岔路口,然後想找到出口。
  • 隨意選擇一個岔路口來走,走著走著發現走不通的時候,就回退到上一個岔路口,重新選擇一條路繼續走,直到最終找到出口。這種走法就是一種深度優先搜尋策略。
  • 如下圖所示,在圖中應用深度優先搜尋,來找某個頂點到另一個頂點的路徑。
  • 搜尋的起始頂點是 s,終止頂點是 t,在圖中尋找一條從頂點 s 到頂點 t 的路徑。
  • 用深度遞迴演算法,把整個搜尋的路徑標記出來了。實線箭頭表示遍歷,虛線箭頭表示回退。
  • 從圖中可以看出,深度優先搜尋找出來的路徑,並不是頂點 s 到頂點 t 的最短路徑。

3.1、實現過程

// 全域性變數或者類成員變數,標記是否找到終點 t
boolean found = false;

/**
 * 深度優先搜尋
 *
 * @param s 起始頂點
 * @param t 終止頂點
 */
public void dfs(int s, int t) {
    found = false;
    // 標記頂點是否被訪問
    boolean[] visited = new boolean[v];
    // prev 用來記錄搜尋路徑,prev[w] = a 表示 w 頂點的上一級節點為 a
    int[] prev = Arrays.stream(new int[v])
            .map(f -> -1).toArray();

    recurDfs(s, t, visited, prev);
    print(prev, s, t);
}

private void recurDfs(int w, int t, boolean[] visited, int[] prev) {
    if (found == true) {
        return;
    }
    visited[w] = true;
    if (w == t) {
        found = true;
        return;
    }
    LinkedList<Integer> wLinked = adj[w];
    for (int i = 0; i < wLinked.size(); ++i) {
        int q = wLinked.get(i);
        if (!visited[q]) {
            prev[q] = w;
            recurDfs(q, t, visited, prev);
        }
    }
}

3.2、複雜度分析

  • 深度搜尋中每條邊最多會被訪問兩次,一次是遍歷,一次是回退。
  • 所以,深度優先搜尋演算法的時間複雜度是 O(E), E 表示邊的個數。
  • 深度優先搜尋演算法的消耗記憶體主要是 visited、 prev 陣列和遞迴呼叫棧。
  • visited、 prev 陣列的大小跟頂點的個數V成正比,遞迴呼叫棧的最大深度不會超過頂點的個數,所以總的空間複雜度就是 O(V)

四,兩者對比

  • 廣度優先搜尋和深度優先搜尋是圖上的兩種最常用、最基本的搜尋演算法,比起其他高階的搜尋演算法,比如A、 IDA等,要簡單粗暴,沒有什麼優化,所以,也被
    叫作暴力搜尋演算法。
  • 所以,這兩種搜尋演算法僅適用於狀態空間不大,也就是說圖不大的搜尋。
  • 廣度優先搜尋,通俗的理解就是,地毯式層層推進,從起始頂點開始,依次往外遍歷。
  • 廣度優先搜尋需要藉助佇列來實現,遍歷得到的路徑就是,起始頂點到終止頂點的最短路徑。
  • 深度優先搜尋用的是回溯思想,非常適合用遞迴實現。換種說法,深度優先搜尋是藉助棧來實現的。
  • 在執行效率方面,深度優先和廣度優先搜尋的時間複雜度都是 O(E),空間複雜度是 O(V)。

相關文章