並查集是一種怎樣的資料結構？

bigsai發表於2021-06-22

原文網址 : https://www.cnblogs.com/bigsai/p/14917450.html

什麼是並查集

並查集這種資料結構，可能出現的頻率不是那麼高，但是還會經常性的見到，其理解學習起來非常容易，通過本文，一定能夠輕輕鬆鬆搞定並查集！

對於一種資料結構，肯定是有自己的應用場景和特性，那麼並查集是處理什麼問題的呢？

並查集是一種樹型的資料結構，用於處理一些不相交集合（disjoint sets）的合併及查詢問題,常常在使用中以森林來表示。在一些有N個元素的集合應用問題中，我們通常是在開始時讓每個元素構成一個單元素的集合，然後按一定順序將屬於同一組的元素所在的集合合併，其間要反覆查詢一個元素在哪個集合中。其特點是看似並不複雜，但資料量極大，若用正常的資料結構來描述的話，往往在空間上過大，計算機無法承受；即使在空間上勉強通過，執行的時間複雜度也極高，根本就不可能在比賽規定的執行時間（1～3秒）內計算出試題需要的結果，只能用並查集來描述。

你可能還有點迷糊並查集能怎麼玩，看完這篇然後回頭看這兩個問題(分別杭電1232和杭電1272)。

問題1：

某省調查城鎮交通狀況，得到現有城鎮道路統計表，表中列出了每條道路直接連通的城鎮。省政府“暢通工程”的目標是使全省任何兩個城鎮間都可以實現交通（但不一定有直接的道路相連，只要互相間接通過道路可達即可）。問最少還需要建設多少條道路？

這個問題很容易，給定的關係看看需要合併多少次就知道最少的建設道路數量。

問題二：

小希希望任意兩個房間有且僅有一條路徑可以相通（除非走了回頭路）。小希現在把她的設計圖給你，讓你幫忙判斷她的設計圖是否符合她的設計思路。比如下面的例子，前兩個是符合條件的，但是最後一個卻有兩種方法從5到達8。

這個問題也很容易了，根據關係集合進行合如果兩個元素已經屬於一個集合，那就說明不滿足要求啦。

並查集解析

通過上面介紹，相信你已經清楚並查集就是解決集合中一些元素的合併和查詢問題，現在就帶你解析這個演算法。

初始化

開始時候森林中每個元素沒有任何操作，它們之間是相互獨立的。我們通常會使用陣列來表示這個森林(陣列下標對應第幾個元素)，在初始化的時候陣列中的各個值為-1，表示各自自己是一個集合(各自為王)，你可能會問為啥是-1而不是一個其他的數，那是因為用負數可以代表這個元素是某個集合的根，然後它的權值表示集合中元素的個數。

並 union(int a,int b)

這裡合併，並沒有你想象的直接合並那麼簡單，這裡合併是合併a所在的集合和b所在的集合，但在操作層面a,b可能並不是根節點，所以也要先判斷一下。

為了便於理解，這裡羅列一下最初操作可能的情況，初始時候各個元素都是獨立的集合，那麼直接a指向b(或者b指向a)即arr[a]=b,同時為了表示這個集合有多少個，原本-1的b再次-1.即arr[b]=-2.表示以b為父根的集合節點有|-2|個。例如進行union(1,4)，union(5,7)操作之後如圖所示：

正常情況的union(int a,int b)，假設我們就是a合併到b上，把b當成父集合來看。a、b都可能是葉子節點，也可能是根節點。

此時你可以先分別找到a,b的父節點fa,fb(這個根可能是它自己),然後合併fa和fb兩個節點，例如上面如果union(1,5)那麼其實就是等價union(4,7)。

為什麼不直接操作a,b而是要找到他們的父親進行操作?

原因1是因為a,b可能是葉子節點，其值是正的表示已經有父親了，如果直接操作會使其與原來的集合分離開。另外集合中的數量(負數)也不能有效疊加。

原因2是因為合併的時候如果合併如果a,b是非根節點操作，可能會造成這個樹的深度太大，不利於集合a中的查詢效率。

查 search(int a)

查詢，其實就是查詢這個節點的根節點是啥(也稱代表元)，這個過程也有點類似遞迴的過程，葉子節點值如果為正，那麼就繼續查詢這個值得位置的結果，一直到值為負數的時候說明找到根節點，可以直接返回。

不過在查詢的過程中可以順便路徑優化，這樣在頻繁查詢能夠大大降低時間複雜度。

優化

你以為上面的就是並查集的全部？不不不，並查集還有不少需要掌握嘞，估計細心的人可能也會發現一些問題。

你可能會有疑問：

如何檢視a，b是否在同一個集合？

檢視是否在一個集合，只需要檢視節點根祖先的結果是否相同即可。因為只有根的數值是負的，而其他都是正數表示指向的元素。所以只需要一直尋找直到不為正數進行比較即可！

a,b合併，究竟是a的祖先合併在b的祖先上，還是b的祖先合併在a上？

這裡會遇到兩種情況，這個選擇也是非常重要的。你要弄明白一點：樹的高度+1的化那麼整個元素查詢的效率都會降低！

所以我們通常是：小樹指向大樹(或者低樹指向高樹)，這個使得查詢效率能夠增加！

當然，在高度和數量的選擇上，還需要你自己選擇和考慮。

查詢途中能不能路徑壓縮

每次查詢，自下向上。當我們呼叫遞迴的時候，可以順便壓縮路徑(將當前陣列的值等於遞迴返回的根節點的值)，我們查詢一個元素只需要直接找到它的祖先，所以當它距離祖先近那麼下次查詢就很快。並且壓縮路徑的代價並不大！

試想一下，如果一個分支的深度為1000，不壓縮路徑那麼這個分支每個節點平均查詢次數為500，壓縮一次下次再查詢就是1次。

學會路徑壓縮，你基本可以秒殺大部分並查集的題。

程式碼實現

並查集實現起來較為簡單，直接貼程式碼！程式碼很久前寫的，如果有紕漏還請指出。

import java.util.Scanner;
public class DisjointSet {
    static int tree[]=new int[100000];//假設有500個值
    public DisjointSet()    {set(this.tree);}
    public DisjointSet(int tree[]) 
    {
        this.tree=tree;
        set(this.tree);
    }
  //初始化所有都是-1 有兩個好處，這樣他們指向-1說明是自己，
  //第二，-1代表當前森林有-（-1）個
    public void set(int a[])
    {
        int l=a.length;
        for(int i=0;i<l;i++)
        {
            a[i]=-1;
        }
    }
    public int search(int a)//返回頭節點的數值
    {
        if(tree[a]>0)//說明是子節點
        {
            return tree[a]=search(tree[a]);//路徑壓縮
        }
        else
            return a;
    }
    public int value(int a)//返回a所在樹的大小（個數）
    {
        if(tree[a]>0)
        {
            return value(tree[a]);
        }
        else
            return -tree[a];
    }
    public void union(int a,int b)//表示 a，b所在的樹合併
    {
        int a1=search(a);//a根
        int b1=search(b);//b根
        if(a1==b1) {System.out.println(a+"和"+b+"已經在一棵樹上");}
        else {
        if(tree[a1]<tree[b1])//這個是負數，為了簡單減少計算，不在呼叫value函式
        {
            tree[a1]+=tree[b1];//個數相加  注意是負數相加
            tree[b1]=a1;       //b樹成為a的子樹，直接指向a；
        }
        else
        {
            tree[b1]+=tree[a1];//個數相加  注意是負數相加
            tree[a1]=b1;       //b樹成為a的子樹，直接指向a；
        }
        }
    }
    public static void main(String[] args)
    {       
        DisjointSet d=new DisjointSet();
        d.union(1,2);
        d.union(3,4);
        d.union(5,6);
        d.union(1,6);

        d.union(22,24);
        d.union(3,26);
        d.union(36,24);
        System.out.println(d.search(6));    //頭
        System.out.println(d.value(6));     //大小
        System.out.println(d.search(22));   //頭
        System.out.println(d.value(22));     //大小
    }
}

結語

並查集屬於簡單但是很高效率的資料結構。在集合中經常會遇到。如果不採用並查集而傳統暴力效率太低，而不被採納。

另外，並查集還廣泛用於迷宮遊戲中，下面有機會可以介紹用並查集實現一個走迷宮小遊戲。大家歡迎關注！

相互吹捧，共同進步，歡迎關注我的公眾號：【bigsai】歡迎加個好友一起學習交流！

資料結構-並查集
2024-10-24
資料結構並查集
資料結構之並查集
2019-08-29
資料結構並查集
優雅的資料結構–並查集
2019-05-12
資料結構並查集
資料結構：速通並查集
2024-09-27
資料結構並查集
【資料結構】帶權並查集
2021-02-17
資料結構並查集
資料結構——並查集學習筆記
2024-07-09
資料結構並查集筆記
並查集（一）並查集的幾種實現
2021-07-20
並查集
演算法與資料結構之並查集
2019-03-01
演算法資料結構並查集
索引是一種讓你快速找到資料的資料結構
2022-11-04
索引資料結構
各種並查集
2024-07-21
並查集
【轉】種類並查集
2020-11-09
並查集
深度學習中資料集很小是一種什麼樣的體驗
2021-03-01
深度學習
資料結構與演算法知識點總結（3）樹、圖與並查集
2022-04-12
資料結構演算法並查集
MYSQL查詢和插入資料的流程是怎樣的
2021-02-18
MySql
[複習] 種類並查集
2024-11-26
並查集
一般後端返回的資料結構是資料庫中的儲存結構，與前端需要展示的結構不一樣對嗎？
2024-03-15
後端資料結構資料庫前端
新高一暑假第一期集訓恢復性訓練【資料結構-雜題小練】（並查集）（補）
2024-10-22
資料結構並查集
HTTP快取是怎樣的一種存在
2019-01-08
HTTP快取
失明是一種怎樣的體驗——見
2019-08-15
並查集（UnionFind）技巧總結
2020-10-16
並查集
B-tree和B+tree 一種為資料查詢而生的結構
2021-11-26
【並查集】【帶偏移的並查集】食物鏈
2024-10-27
並查集
在Linux中，目錄結構是怎樣的？
2024-06-10
Linux
Redis 的五種資料結構
2019-03-02
Redis資料結構
[資料結構] 二分查詢 (四種寫法)
2023-02-05
資料結構
並查集到帶權並查集
2019-07-02
並查集
【並查集】一種與時間賽跑的巧妙演算法
2020-09-20
並查集演算法
磁碟到底是怎樣工作的？一文理解硬碟結構
2020-12-22
硬碟
萬里資料庫是一家怎樣的公司？
2022-06-16
資料庫
並查集的使用
2018-04-24
並查集
組織結構圖是什麼？怎樣繪製結構圖？
2020-03-03
PHP 資料採集的一種思路
2019-01-04
PHP
POJ-1182-食物鏈（並查集種類）
2020-04-07
並查集
查並集
2020-11-25
在遊戲中，“我”是一種怎樣的存在？
2019-12-25
遊戲
在騰訊工作是一種怎樣的體驗？
2021-08-06
掃碼無憂是一種怎樣的體驗？
2021-02-02
如何定義一個自帶資料區的結構體：三種資料結構體的比較
2021-07-22
結構體資料結構

並查集是一種怎樣的資料結構？

什麼是並查集

並查集解析

優化

程式碼實現

結語

相關文章