【並查集】一種與時間賽跑的巧妙演算法

大國夢_小兔子發表於2020-09-20

原文網址 : https://www.cnblogs.com/pqh-/p/13699925.html

【並查集】一種與時間賽跑的巧妙演算法

引入：（NOIP模擬題）極端寒冬

（不要求剛剛接觸並查集的讀者完全明白本題）

先了解一下並查集是個什麼東西：
合併兩點所在集合 和 查詢兩點是否在同一集合 的演算法

那有什麼用處呢？
我們先來看一道NOIP模擬題在這裡插入圖片描述
我們先來看一下題意是什麼：
首先，有一個n*m的地圖，k個障礙，每個障礙會按順序在不同的時間冒出
問地圖上最多能容納多少個障礙，使得從(1,1)到(n,m)仍保持聯通

那我們可以怎麼做呢？
最先也是最容易想到的就是搜尋
每次新增一個障礙，就搜尋判斷地圖的連通性

但是，時間複雜度約為O(k(n*m)) ~~[口胡]~~
3 * 10^4^ * 3 * 10^4^ * 10^5^ = 9 * 10^13^
超時，但小資料應該勉強能拿2、30分

然後我們會想到做分塊（分塊思想：從疫情中的體溫測量到分塊思想的運用）
如果給k個障礙，那麼我們把他分成√k堆，每堆√k個障礙
每次新增√k個障礙，然後搜尋判斷連通性
如果不連通，再對√k個障礙，挨個搜尋判斷連通性

那麼，時間複雜度約為O(√k(nm)2) ~~[口胡]~~
時間還是不夠，必定會超時，勉強拿40分

之後我們會想到更快的暴力：二分答案
如果給k個障礙，那麼我們把他分成2堆，每堆k/2個障礙
新增k/2個障礙，之後搜尋判斷連通性
左側不連通就二分再次左側，右側不連通就二分再次右側
最後就能找到最多能容納的障礙

所以時間複雜度約為O(㏒(k)*(n *m)) ~~[口胡]~~
所用時間也還是較大，估計拿50分左右

那麼正解是什麼呢？
我們會發現所用時間較大與去搜尋連通性有密切關係
地圖越大，就算優化列舉障礙放置，搜尋連通性也耗時過多

那麼，我們可以不去搜尋地圖的連通性嗎？
答案是可以的
我們可以知道，地圖如果不連通
那麼障礙一定是從地圖左/下邊界一直連通到右、上側邊界的

在這裡插入圖片描述這很容易證明，過程略

所以題目就轉化為了障礙是否具有連通性
（從地圖左/下邊界一直連通到右/上側邊界是否具有連通性）

可以列舉+染色，也不復雜的暴力
但時間還沒有最優

所以我們想到並查集
去合併障礙，看障礙的連通性
賣個關子，我們先講一下並查集的主要內容

並查集

剛剛說過，並查集是合併兩點所在集合 和 查詢兩點是否在同一集合 的演算法

瞭解

並查集本質是樹狀結構
把每個集合看成一棵樹
初始時，每個點就是一棵樹
每次合併是將兩棵樹的根節點連線
合併集合像歸順之類的一樣：樹A和樹B，A和B有關係，A就加入B，A的根節點就是B的根節點
查詢節點是否在同一集合就去查詢：節點X和Y，X所在樹的根節點是否等於 Y的所在樹根節點
網上已經說得很詳細了，就不贅述了

江湖上散落著各式各樣的大俠，有上千個之多。他們沒有什麼正當職業，整天揹著劍在外面走來走去，碰到和自己不是一路人的，就免不了要打一架。但大俠們有一個優點就是講義氣，絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”，只要是能通過朋友關係串聯起來的，不管拐了多少個彎，都認為是自己人。這樣一來，江湖上就形成了一個一個的幫派，通過兩兩之間的朋友關係串聯起來。而不在同一個幫派的人，無論如何都無法通過朋友關係連起來，於是就可以放心往死了打。但是兩個原本互不相識的人，如何判斷是否屬於一個朋友圈呢？
我們可以在每個朋友圈內推舉出一個比較有名望的人，作為該圈子的代表人物。這樣，每個圈子就可以這樣命名“中國同胞隊”美國同胞隊”……兩人只要互相對一下自己的隊長是不是同一個人，就可以確定敵友關係了。
但是還有問題啊，大俠們只知道自己直接的朋友是誰，很多人壓根就不認識隊長抓狂要判斷自己的隊長是誰，只能漫無目的的通過朋友的朋友關係問下去：“你是不是隊長？你是不是隊長？”這樣，想打一架得先問個幾十年，餓都餓死了，受不了。這樣一來，隊長面子上也掛不住了，不僅效率太低，還有可能陷入無限迴圈中。於是隊長下令，重新組隊。隊內所有人實行分等級制度，形成樹狀結構，我隊長就是根節點，下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候，只要一層層向上問，直到最高層，就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否是一個幫派的，至於他們是如何通過朋友關係相關聯的，以及每個圈子內部的結構是怎樣的，甚至隊長是誰，都不重要了。所以我們可以放任隊長隨意重新組隊，只要不搞錯敵友關係就好了。於是，門派產生了。
下面我們來看並查集的實現。 int fa[1000]; 這個陣列，記錄了每個大俠的上級是誰。大俠們從1或者0開始編號（依據題意而定），fa[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己，那說明他就是掌門人了，查詢到此為止。也有孤家寡人自成一派的，比如歐陽鋒，那麼他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰？不認識！要想知道自己的掌門是誰，只能一級級查上去。
再來看看加入門派，就是在兩個點之間連一條線，這樣一來，原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦，畫條線就行了。但我們現在是用並查集來描述武林中的狀況的，一共只有一個fa[]陣列，該如何實現呢？還是舉江湖的例子，假設現在武林中的形勢如圖所示。虛竹帥鍋與周芷若MM是我非常喜歡的兩個人物，他們的終極boss分別是玄慈方丈和滅絕師太，那明顯就是兩個陣營了。我不希望他們互相打架，就對他倆說：“你們兩位拉拉勾，做好朋友吧。”他們看在我的面子上，同意了。這一同意可非同小可，整個少林和峨眉派的人就不能打架了。這麼重大的變化，可如何實現呀，要改動多少地方？其實非常簡單，我對玄慈方丈說：“大師，麻煩你把你的上級改為滅絕師太吧。這樣一來，兩派原先的所有人員的終極boss都是師太，那還打個球啊！大笑反正我們關心的只是連通性，門派內部的結構不要緊的。”玄慈一聽肯定火大了：“我靠，憑什麼是我變成她手下呀，怎麼不反過來？我抗議！”於是，兩人相約一戰，殺的是天昏地暗，風雲為之變色啊，但是啊，這場戰爭終究會有勝負，勝者為王。弱者就被吞併了。反正誰加入誰效果是一樣的，門派就由兩個變成一個了。這段函式的意思明白了吧？
再來看看路徑壓縮演算法。建立門派的過程是用加入函式兩個人兩個人地連線起來的，誰當誰的手下完全隨機。最後的樹狀結構會變成什麼樣，我也無法預知，一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門，一共就兩級結構，只要找一次就找到掌門了。哪怕不能完全做到，也最好儘量接近。這樣就產生了路徑壓縮演算法。
設想這樣一個場景：兩個互不相識的大俠碰面了，想知道能不能幹一場。於是趕緊打電話問自己的上級：“你是不是掌門？” 上級說：“我不是呀，我的上級是誰誰誰，你問問他看看。” 一路問下去，原來兩人的最終boss都是東廠曹公公。 “哎呀呀，原來是自己人，有禮有禮，在下三營六組白麵葫蘆娃!” “幸會幸會，在下九營十八組仙子狗尾巴花！” 兩人高高興興地手拉手喝酒去了。 “等等等等，兩位大俠請留步，還有事情沒完成呢！”我叫住他倆。 “哦，對了，還要做路徑壓縮。”兩人醒悟。白麵葫蘆娃打電話給他的上級六組長：“組長啊，我查過了，其實偶們的掌門是曹公公。不如偶們一起結拜在曹公公手下吧，省得級別太低，以後查詢掌門麻煩。” “唔，有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。這樣，查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理，所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的程式碼，看得懂很好，看不懂可以自己模擬一下，很簡單的一個遞迴而已。總之它所實現的功能就是這麼個意思。

寫的還挺好，我們再詳細說說

實現

初始化

首先初始化每個節點，使得他們自成一樹

void in(){
	for(int i=1;i<=n;i++){
		fa[i]=i;//樹的根節點
		h[i]=1;//樹的深度
	}
}

所以得到：

在這裡插入圖片描述

合併

然後我們對他們進行合併操作：在這裡插入圖片描述
直接將有關係的點進行連線

int get(int x,int y){
	f[f[x]]=y;//將X點的根節點掛到Y上
}

但我們會發現，最壞的情況是出現了一條鏈，fa指向自己上一個節點
查詢根節點就會很慢，時間複雜度為O(h)
（下圖注：例圖，與剛剛資料無關）
在這裡插入圖片描述
那麼，我們可以每次合併兩棵樹時，樹A掛在樹B的根節點上

以剛剛的資料為例4和2的關係：
理論上應該連線2和4
但為了防止鏈，導致find的查詢根節點變慢
就樹A根節點連線到樹B根節點

我們再來說一下樹A根節點連B根節點的方法
在這裡插入圖片描述 如圖，是A掛B好還是B掛A好？
（h大為深，h小為淺）
當然是淺的樹掛在深的樹上好唄

淺的樹掛在深的樹的根節點上，淺的樹一側深度+1（因為頂上多了個深的樹的根節點）
h[淺的樹]+1<=h[深的樹]
而深的樹掛在淺的樹的根節點上，深的樹一側深度+1（因為頂上多了個淺的樹的根節點）
h[深的樹]+1>=h[深的樹]
∴h[淺的樹]+1<h[深的樹]+1
∵h越小查詢時間越低
∴淺的樹掛在深的樹更優

void get(int x,int y){
	x=find(x);
	y=find(y);
	if(x==y)return ;//x,y是同一父親節點 ，不需要合併 
	else{
		if(h[x]>h[y]){
			fa[y]=x;
		}else if(h[x]<h[y]){
			fa[x]=y;
		}else if(h[x]==h[y]){//兩樹深度相同
			fa[x]=y;
			h[x]++;
		}
	}
	
}

我們再來說一下程式碼，程式碼考慮到兩樹深度相同
那麼，就隨便掛了，反正最後深度都會+1（因為一棵樹頂上多了個另一棵樹的根節點）

然後，我們發現
其實最優的應該是所有節點都掛在根節點上（建立直接聯絡）
我們把這種想法稱為路徑壓縮
最後查詢的時間可以達到O(1)~~（最理想狀態）~~
在這裡插入圖片描述
但不是所有都需要路徑壓縮，有很多時候我們合併過後並不會去查詢他
壓縮反而會浪費時間，那我們就在查詢的時候順便合併，方便以後的查詢
怎麼實現呢？

查詢

int find(int i){
	if(i==fa[i]){//找到i的根節點
		return i;
	}else{
		find(f[i]);//找i的根節點
	}
}

先看程式碼，查詢的實質就是遞迴
這是與剛剛最原始的程式碼配合使用，但這其實是偽的並查集

//偽的並查集
void in(){
	for(int i=1;i<=n;i++){
		fa[i]=i;
		//h[i]=1;
	}
}
int get(int x,int y){
	f[f[x]]=y;
}
int find(int i){
	if(i==fa[i]){
		return i;
	}else{
		find(f[i]);
	}
}

剛剛我們說道在查詢的時候順便合併，方便以後的查詢，怎麼實現呢？

int find(int i){
	if(i==fa[i]){//找到i的根節點
		return i;//返回i的根節點
	}
	else{
		fa[i]=find(fa[i]);//把i掛到根節點上
		return find(fa[i]);//結束
	}
}

這裡還有一個細節可以優化
將find(fa[i])=x，這樣else的地方find只用呼叫一次，而不用呼叫兩次
時間也能減少不少

int find(int i){
	if(i==fa[i]){//找到i的根節點
		return i;//返回i的根節點
	}
	else{
		int x=find(fa[i]);
		fa[i]=x;//把i掛到根節點上
		return x;//結束
	}
}

是否在同一集合

很簡單，就看X點和Y點是否有同一根節點

bool same(int x,int y){
	return find(x)==find(y);
}

模板

#include<bits/stdc++.h>
using namespace std;
int fa[1010];
int h[1010];

void in(){//初始化 
	for(int i=1;i<=n;i++){
		fa[i]=i;
		h[i]=1;
	}
}
int find(int i){//查（查詢根節點 
	if(i==fa[i]){
		return i;
	}
	else{
		int x=find(fa[i]);
		fa[i]=x;
		return x;
	}
}
void get(int x,int y){//並（合併 
	x=find(x);
	y=find(y);
	if(x==y)return ;
	else{
		if(h[x]>h[y]){
			fa[y]=x;
		}else if(h[x]<h[y]){
			fa[x]=y;
		}else if(h[x]==h[y]){
			fa[x]=y;
			h[x]++;
		}
	}
	
}

bool same(int x,int y){//集（是否在同一集合 
	return find(x)==find(y);
}

int main(){
	//……其他操作 
	
	
	return 0;
}

（NOIP模擬題）極端寒冬

（見： 引入：（NOIP模擬題）極端寒冬）
這個題目用並查集來做
把每個障礙看做一個點
然後按時間T的變化，看當前時間
障礙的八個方向是否有其他已生成的障礙
在這裡插入圖片描述
若有一個已生成的障礙B，那就把當前障礙A連入B所在的集合
若有更多已生成的障礙（以B和C為例），那就將當前障礙A連入B所在的集合，C所在的集合也連入

如果地圖左/下邊界和右/上側邊界有任意兩障礙在同一集合
說明障礙具有連通性，地圖無法連通

那麼就輸出當前的障礙值

擴充：帶權值的並查集

基於路徑壓縮，我我們可以讓並查集帶有權值
帶權值的並查集用v[]記錄權值，用find()來實現

所以find()的過程中，需要加上權值的更新操作

做find()時
從根到節點權值=從根節點開始返回上層的權值累加到當前這個權值
然後再將節點掛到根上

int find(int i){
	if(i==fa[i]){//找到i的根節點
		return i;//返回i的根節點
	}
	else{
		int x=find(fa[i]);
		fa[i]=x;//把i掛到根節點上
		v[i]+=v[x];//權值更新
		return x;//結束
	}
}

END

並查集（一）並查集的幾種實現
2021-07-20
並查集
並查集的概念與演算法實現
2018-04-25
並查集演算法
各種並查集
2024-07-21
並查集
並查集（二）並查集的演算法應用案例上
2021-07-24
並查集演算法
並查集演算法
2021-04-16
並查集演算法
【轉】種類並查集
2020-11-09
並查集
[複習] 種類並查集
2024-11-26
並查集
簡單易懂的並查集演算法以及並查集實戰演練
2021-01-31
並查集演算法
演算法與資料結構之並查集
2019-03-01
演算法資料結構並查集
並查集是一種怎樣的資料結構？
2021-06-22
並查集資料結構
序列並查集的線性演算法
2021-01-31
並查集演算法
【並查集】【帶偏移的並查集】食物鏈
2024-10-27
並查集
並查集到帶權並查集
2019-07-02
並查集
[演算法學習筆記] 並查集
2024-04-24
演算法筆記並查集
並查集的使用
2018-04-24
並查集
POJ-1182-食物鏈（並查集種類）
2020-04-07
並查集
查並集
2020-11-25
一些“並查集”雜燴
2024-05-16
並查集
並查集(小白)
2024-04-03
並查集
[leetcode] 並查集（Ⅱ）
2020-05-30
LeetCode並查集
[leetcode] 並查集（Ⅲ）
2020-05-31
LeetCode並查集
[leetcode] 並查集（Ⅰ）
2020-04-27
LeetCode並查集
3.1並查集
2024-10-02
並查集
一種巧妙的drawable.xml替代方案
2018-09-10
XML
並查集 - 紅色警報 - 天梯賽 L2-013
2020-11-25
並查集
資料結構與演算法知識點總結（3）樹、圖與並查集
2022-04-12
資料結構演算法並查集
轉載：一個python並查集類
2020-02-12
Python並查集
並查集的應用2
2019-03-24
並查集
並查集應用
2018-08-12
並查集
寫模板，並查集。
2024-03-25
並查集
並查集跳躍
2024-07-21
並查集
淺談並查集
2024-11-28
並查集
食物鏈（並查集）
2024-11-13
並查集
並查集（Union Find）
2021-05-21
並查集
The Door Problem 並查集
2021-01-04
並查集
並查集練習
2020-11-25
並查集
起亞奕跑什麼時候上市的起亞奕跑上市時間
2022-03-04
並查集演算法Union-Find的思想、實現以及應用
2020-10-17
並查集演算法

【並查集】一種與時間賽跑的巧妙演算法

引入：（NOIP模擬題）極端寒冬

並查集

瞭解

實現

初始化

合併

查詢

是否在同一集合

模板

（NOIP模擬題）極端寒冬

擴充：帶權值的並查集

相關文章