【並查集】一種與時間賽跑的巧妙演算法
引入:(NOIP模擬題)極端寒冬
(不要求剛剛接觸並查集的讀者完全明白本題)
先了解一下並查集是個什麼東西:
合併兩點所在集合 和 查詢兩點是否在同一集合 的演算法
那有什麼用處呢?
我們先來看一道NOIP模擬題
我們先來看一下題意是什麼:
首先,有一個n*m的地圖,k個障礙,每個障礙會按順序在不同的時間冒出
問地圖上最多能容納多少個障礙,使得從(1,1)到(n,m)仍保持聯通
那我們可以怎麼做呢?
最先也是最容易想到的就是搜尋
每次新增一個障礙,就搜尋判斷地圖的連通性
但是,時間複雜度約為O(k(n*m)) [口胡]
3 * 10^4^ * 3 * 10^4^ * 10^5^ = 9 * 10^13^
超時,但小資料應該勉強能拿2、30分
然後我們會想到做分塊(分塊思想:從疫情中的體溫測量到分塊思想的運用 )
如果給k個障礙,那麼我們把他分成√k堆,每堆√k個障礙
每次新增√k個障礙,然後搜尋判斷連通性
如果不連通,再對√k個障礙,挨個搜尋判斷連通性
那麼,時間複雜度約為O(√k(nm)2) [口胡]
時間還是不夠,必定會超時,勉強拿40分
之後我們會想到更快的暴力:二分答案
如果給k個障礙,那麼我們把他分成2堆,每堆k/2個障礙
新增k/2個障礙,之後搜尋判斷連通性
左側不連通就二分再次左側,右側不連通就二分再次右側
最後就能找到最多能容納的障礙
所以時間複雜度約為O(㏒(k)*(n *m)) [口胡]
所用時間也還是較大,估計拿50分左右
那麼正解是什麼呢?
我們會發現所用時間較大與去搜尋連通性有密切關係
地圖越大,就算優化列舉障礙放置,搜尋連通性也耗時過多
那麼,我們可以不去搜尋地圖的連通性嗎?
答案是可以的
我們可以知道,地圖如果不連通
那麼障礙一定是從地圖左/下邊界一直連通到右、上側邊界的
這很容易證明,過程略
所以題目就轉化為了障礙是否具有連通性
(從地圖左/下邊界一直連通到右/上側邊界是否具有連通性)
可以列舉+染色,也不復雜的暴力
但時間還沒有最優
所以我們想到並查集
去合併障礙,看障礙的連通性
賣個關子,我們先講一下並查集的主要內容
並查集
剛剛說過,並查集是合併兩點所在集合 和 查詢兩點是否在同一集合 的演算法
瞭解
並查集本質是樹狀結構
把每個集合看成一棵樹
初始時,每個點就是一棵樹
每次合併是將兩棵樹的根節點連線
合併集合像歸順之類的一樣:樹A和樹B,A和B有關係,A就加入B,A的根節點就是B的根節點
查詢節點是否在同一集合就去查詢:節點X和Y,X所在樹的根節點 是否等於 Y的所在樹根節點
網上已經說得很詳細了,就不贅述了
江湖上散落著各式各樣的大俠,有上千個之多。他們沒有什麼正當職業,整天揹著劍在外面走來走去,碰到和自己不是一路人的,就免不了要打一架。但大俠們有一個優點就是講義氣,絕對不打自己的朋友。而且他們信奉“朋友的朋友就是我的朋友”,只要是能通過朋友關係串聯起來的,不管拐了多少個彎,都認為是自己人。這樣一來,江湖上就形成了一個一個的幫派,通過兩兩之間的朋友關係串聯起來。而不在同一個幫派的人,無論如何都無法通過朋友關係連起來,於是就可以放心往死了打。但是兩個原本互不相識的人,如何判斷是否屬於一個朋友圈呢?
我們可以在每個朋友圈內推舉出一個比較有名望的人,作為該圈子的代表人物。這樣,每個圈子就可以這樣命名“中國同胞隊”美國同胞隊”……兩人只要互相對一下自己的隊長是不是同一個人,就可以確定敵友關係了。
但是還有問題啊,大俠們只知道自己直接的朋友是誰,很多人壓根就不認識隊長抓狂要判斷自己的隊長是誰,只能漫無目的的通過朋友的朋友關係問下去:“你是不是隊長?你是不是隊長?”這樣,想打一架得先問個幾十年,餓都餓死了,受不了。這樣一來,隊長面子上也掛不住了,不僅效率太低,還有可能陷入無限迴圈中。於是隊長下令,重新組隊。隊內所有人實行分等級制度,形成樹狀結構,我隊長就是根節點,下面分別是二級隊員、三級隊員。每個人只要記住自己的上級是誰就行了。遇到判斷敵友的時候,只要一層層向上問,直到最高層,就可以在短時間內確定隊長是誰了。由於我們關心的只是兩個人之間是否是一個幫派的,至於他們是如何通過朋友關係相關聯的,以及每個圈子內部的結構是怎樣的,甚至隊長是誰,都不重要了。所以我們可以放任隊長隨意重新組隊,只要不搞錯敵友關係就好了。於是,門派產生了。
下面我們來看並查集的實現。 int fa[1000]; 這個陣列,記錄了每個大俠的上級是誰。大俠們從1或者0開始編號(依據題意而定),fa[15]=3就表示15號大俠的上級是3號大俠。如果一個人的上級就是他自己,那說明他就是掌門人了,查詢到此為止。也有孤家寡人自成一派的,比如歐陽鋒,那麼他的上級就是他自己。每個人都只認自己的上級。比如胡青牛同學只知道自己的上級是楊左使。張無忌是誰?不認識!要想知道自己的掌門是誰,只能一級級查上去。
再來看看加入門派,就是在兩個點之間連一條線,這樣一來,原先它們所在的兩個板塊的所有點就都可以互通了。這在圖上很好辦,畫條線就行了。但我們現在是用並查集來描述武林中的狀況的,一共只有一個fa[]陣列,該如何實現呢? 還是舉江湖的例子,假設現在武林中的形勢如圖所示。虛竹帥鍋與周芷若MM是我非常喜歡的兩個人物,他們的終極boss分別是玄慈方丈和滅絕師太,那明顯就是兩個陣營了。我不希望他們互相打架,就對他倆說:“你們兩位拉拉勾,做好朋友吧。”他們看在我的面子上,同意了。這一同意可非同小可,整個少林和峨眉派的人就不能打架了。這麼重大的變化,可如何實現呀,要改動多少地方?其實非常簡單,我對玄慈方丈說:“大師,麻煩你把你的上級改為滅絕師太吧。這樣一來,兩派原先的所有人員的終極boss都是師太,那還打個球啊!大笑反正我們關心的只是連通性,門派內部的結構不要緊的。”玄慈一聽肯定火大了:“我靠,憑什麼是我變成她手下呀,怎麼不反過來?我抗議!”於是,兩人相約一戰,殺的是天昏地暗,風雲為之變色啊,但是啊,這場戰爭終究會有勝負,勝者為王。弱者就被吞併了。反正誰加入誰效果是一樣的,門派就由兩個變成一個了。這段函式的意思明白了吧?
再來看看路徑壓縮演算法。建立門派的過程是用加入函式兩個人兩個人地連線起來的,誰當誰的手下完全隨機。最後的樹狀結構會變成什麼樣,我也無法預知,一字長蛇陣也有可能。這樣查詢的效率就會比較低下。最理想的情況就是所有人的直接上級都是掌門,一共就兩級結構,只要找一次就找到掌門了。哪怕不能完全做到,也最好儘量接近。這樣就產生了路徑壓縮演算法。
設想這樣一個場景:兩個互不相識的大俠碰面了,想知道能不能幹一場。 於是趕緊打電話問自己的上級:“你是不是掌門?” 上級說:“我不是呀,我的上級是誰誰誰,你問問他看看。” 一路問下去,原來兩人的最終boss都是東廠曹公公。 “哎呀呀,原來是自己人,有禮有禮,在下三營六組白麵葫蘆娃!” “幸會幸會,在下九營十八組仙子狗尾巴花!” 兩人高高興興地手拉手喝酒去了。 “等等等等,兩位大俠請留步,還有事情沒完成呢!”我叫住他倆。 “哦,對了,還要做路徑壓縮。”兩人醒悟。 白麵葫蘆娃打電話給他的上級六組長:“組長啊,我查過了,其實偶們的掌門是曹公公。不如偶們一起結拜在曹公公手下吧,省得級別太低,以後查詢掌門麻煩。” “唔,有道理。” 白麵葫蘆娃接著打電話給剛才拜訪過的三營長……仙子狗尾巴花也做了同樣的事情。 這樣,查詢中所有涉及到的人物都聚集在曹公公的直接領導下。每次查詢都做了優化處理,所以整個門派樹的層數都會維持在比較低的水平上。路徑壓縮的程式碼,看得懂很好,看不懂可以自己模擬一下,很簡單的一個遞迴而已。總之它所實現的功能就是這麼個意思。
寫的還挺好,我們再詳細說說
實現
初始化
首先初始化每個節點,使得他們自成一樹
void in(){
for(int i=1;i<=n;i++){
fa[i]=i;//樹的根節點
h[i]=1;//樹的深度
}
}
所以得到:
合併
然後我們對他們進行合併操作:
直接將有關係的點進行連線
int get(int x,int y){
f[f[x]]=y;//將X點的根節點掛到Y上
}
但我們會發現,最壞的情況是出現了一條鏈,fa指向自己上一個節點
查詢根節點就會很慢,時間複雜度為O(h)
(下圖注:例圖,與剛剛資料無關)
那麼,我們可以每次合併兩棵樹時,樹A掛在樹B的根節點上
以剛剛的資料為例4和2的關係:
理論上應該連線2和4
但為了防止鏈,導致find的查詢根節點變慢
就樹A根節點連線到樹B根節點
我們再來說一下樹A根節點連B根節點的方法
如圖,是A掛B好還是B掛A好?
(h大為深,h小為淺)
當然是淺的樹掛在深的樹上好唄
淺的樹掛在深的樹的根節點上,淺的樹一側深度+1(因為頂上多了個深的樹的根節點)
h[淺的樹]+1<=h[深的樹]
而深的樹掛在淺的樹的根節點上,深的樹一側深度+1(因為頂上多了個淺的樹的根節點)
h[深的樹]+1>=h[深的樹]
∴h[淺的樹]+1<h[深的樹]+1
∵h越小查詢時間越低
∴淺的樹掛在深的樹更優
void get(int x,int y){
x=find(x);
y=find(y);
if(x==y)return ;//x,y是同一父親節點 ,不需要合併
else{
if(h[x]>h[y]){
fa[y]=x;
}else if(h[x]<h[y]){
fa[x]=y;
}else if(h[x]==h[y]){//兩樹深度相同
fa[x]=y;
h[x]++;
}
}
}
我們再來說一下程式碼,程式碼考慮到兩樹深度相同
那麼,就隨便掛了,反正最後深度都會+1(因為一棵樹頂上多了個另一棵樹的根節點)
然後,我們發現
其實最優的應該是所有節點都掛在根節點上(建立直接聯絡)
我們把這種想法稱為路徑壓縮
最後查詢的時間可以達到O(1)(最理想狀態)
但不是所有都需要路徑壓縮,有很多時候我們合併過後並不會去查詢他
壓縮反而會浪費時間,那我們就在查詢的時候順便合併,方便以後的查詢
怎麼實現呢?
查詢
int find(int i){
if(i==fa[i]){//找到i的根節點
return i;
}else{
find(f[i]);//找i的根節點
}
}
先看程式碼,查詢的實質就是遞迴
這是與剛剛最原始的程式碼配合使用,但這其實是偽的並查集
//偽的並查集
void in(){
for(int i=1;i<=n;i++){
fa[i]=i;
//h[i]=1;
}
}
int get(int x,int y){
f[f[x]]=y;
}
int find(int i){
if(i==fa[i]){
return i;
}else{
find(f[i]);
}
}
剛剛我們說道在查詢的時候順便合併,方便以後的查詢,怎麼實現呢?
int find(int i){
if(i==fa[i]){//找到i的根節點
return i;//返回i的根節點
}
else{
fa[i]=find(fa[i]);//把i掛到根節點上
return find(fa[i]);//結束
}
}
這裡還有一個細節可以優化
將find(fa[i])=x,這樣else的地方find只用呼叫一次,而不用呼叫兩次
時間也能減少不少
int find(int i){
if(i==fa[i]){//找到i的根節點
return i;//返回i的根節點
}
else{
int x=find(fa[i]);
fa[i]=x;//把i掛到根節點上
return x;//結束
}
}
是否在同一集合
很簡單,就看X點和Y點是否有同一根節點
bool same(int x,int y){
return find(x)==find(y);
}
模板
#include<bits/stdc++.h>
using namespace std;
int fa[1010];
int h[1010];
void in(){//初始化
for(int i=1;i<=n;i++){
fa[i]=i;
h[i]=1;
}
}
int find(int i){//查(查詢根節點
if(i==fa[i]){
return i;
}
else{
int x=find(fa[i]);
fa[i]=x;
return x;
}
}
void get(int x,int y){//並(合併
x=find(x);
y=find(y);
if(x==y)return ;
else{
if(h[x]>h[y]){
fa[y]=x;
}else if(h[x]<h[y]){
fa[x]=y;
}else if(h[x]==h[y]){
fa[x]=y;
h[x]++;
}
}
}
bool same(int x,int y){//集(是否在同一集合
return find(x)==find(y);
}
int main(){
//……其他操作
return 0;
}
(NOIP模擬題)極端寒冬
(見: 引入:(NOIP模擬題)極端寒冬 )
這個題目用並查集來做
把每個障礙看做一個點
然後按時間T的變化,看當前時間
障礙的八個方向是否有其他已生成的障礙
若有一個已生成的障礙B,那就把當前障礙A連入B所在的集合
若有更多已生成的障礙(以B和C為例),那就將當前障礙A連入B所在的集合,C所在的集合也連入
如果地圖左/下邊界和右/上側邊界有任意兩障礙在同一集合
說明障礙具有連通性,地圖無法連通
那麼就輸出當前的障礙值
擴充:帶權值的並查集
基於路徑壓縮,我我們可以讓並查集帶有權值
帶權值的並查集用v[]記錄權值,用find()來實現
所以find()的過程中,需要加上權值的更新操作
做find()時
從根到節點權值=從根節點開始返回上層的權值累加到當前這個權值
然後再將節點掛到根上
int find(int i){
if(i==fa[i]){//找到i的根節點
return i;//返回i的根節點
}
else{
int x=find(fa[i]);
fa[i]=x;//把i掛到根節點上
v[i]+=v[x];//權值更新
return x;//結束
}
}
END