樹狀陣列入門(簡單的原理講解)

烏克蘭大野豬發表於2019-08-01

樹狀陣列可以解決什麼樣的問題:

這裡通過一個簡單的題目展開介紹,先輸入一個長度為n的陣列,然後我們有如下兩種操作:

  1. 輸入一個數m,輸出陣列中下標1~m的字首和
  2. 對某個指定下標的數進行值的修改

多次執行上述兩種操作


尋常方法
對於一個的陣列,如果需要求1~m的字首和我們可以將其從下標1開始對m個數進行求和,對於n次操作,時間複雜度是O(n^2),對於值的修改,我們可以直接通過下標找到要修改的數,n次操作時間複雜度為O(n),在陣列n開得比較大的時候,求字首和的效率顯得低了

  • 那麼有人提出了一種優化的方式:
    初始我們用一個陣列A的儲存每個位置的初始值,然後用一個輔助陣列B存放的是下標為i的時候A陣列的前i個的和(字首和),那麼當我們需要查詢m個數的字首和的時候只要直接使用下標對B陣列進行查詢即可,n次查詢,時間複雜度為O(n),而此時,對於單點更新值的維護消耗,由原來的O(n)變成了O(n^2),因為每一次與更新單點值都會對後面的已經計算好的B陣列字首和的值造成影響,需要不斷更新B陣列的值,n次更新維護的消耗自然就變成了O(n^2),更新的效率變得低下

樹狀陣列
那麼是否有一種方法可以讓查詢和更新的時間複雜度都小一些呢,至少可以令人接受,這裡將介紹樹狀陣列如何處理字首和查詢和單點更新的問題,對於n次操作,時間複雜度都為O(nlogn)

  • 借用百度百科上的圖片
    圖1.jpg
    圖2.jpg

如圖,對於一個長度為n的陣列,A陣列存放的是陣列的初始值,引入一個輔助陣列C(我們通過C陣列建立樹狀陣列)

C1 = A1
C2 = C1 + A2 = A1 + A2
C3 = A3
C4 = C2 + C3 + A4 = A1 + A2 + A3 + A4
C5 = A5
C6 = C5 + A6 = A5 + A6
C7 = A7
C8 = C4 + C6 + C7 + A8 = A1 + A2 + A3 + A4 + A5 + A6 + A7 + A8

我們稱C[i]的值為下標為i的數所管轄的數的和,C[8]存放的就是被編號8所管轄的那些數的和(有8個),而下標為i的數所管轄的元素的個數則為2^k個(k為i的二進位制的末尾0的個數)舉兩個例子查詢下標m==8和m==5所管轄的數的和

  • 8 = 1000,末尾3個0,故k == 3,所管轄的個數為2^3 == 8,C8是8個數的和
  • 5 = 0101,末尾沒有0,故k == 0,所管轄的個數為2^0 == 1,C5是一個數的和(它本身A5)

而對於輸入的數m,我們要求編號為m的數的字首和A1~Am(這裡假設樹狀陣列已經建立,即C1~C8的值已經求出,彆著急,在本文的最下方會做出建立樹狀陣列的過程講解,因為現在是在求字首和,就假設C陣列已經可用了吧)舉兩個例子m==7和m==6(sum(i)表示求編號為i的字首和)

  • m==7 sum(7) = C7 + C6 + C4
    那麼我們是怎麼得到編號7是由哪幾個C[i]求和得到呢(C4, C6, C7怎麼得到的),這裡有介紹一種巧妙的方法:
    對於查詢的m,將它轉換成二進位制後,不斷對末尾的1的位置進行-1的操作,直到全部為0停止
    7的二進位制為0111(C7得到),那麼先對0111的末尾1的位置-1,得到0110 == 6(C6得到),再對0110末尾1位置-1,得到0100 == 4(C4得到),最後對0100末尾1位置-1後得到0000(結束訊號),計算停止,至此C7,C6,C4全部得到,求和後就是m == 7時它的字首和
  • m==6 sum(6) = C6 + C4
    m == 6時也是一樣,先轉成2進位制等於0110,經過兩次變換後為0100(C4)和0000(結束訊號),那麼求和後同樣也得到了預計的結果

這裡要介紹一個高效的方法,lowbit(int m),這是一個函式,它的作用是求出m的二進位制表示的末尾1的位置,對於要查詢m的字首和,m = m - lowbit(m)代表不斷對二進位制末尾1進行-1操作,不斷執行直到m == 0結束,就能得到字首和由哪幾個Cm構成,十分巧妙,lowbit也是樹狀陣列的核心

int lowbit(int m){
    return m&(-m);
}

關於m&(-m)很多童鞋可能感到困惑,那麼就不得不提及一下負數在計算機記憶體中的儲存形式,負數在計算機中是以補碼的形式儲存的,如13的二進位制表示為1101,那麼-13的二進位制而將13二進位制按位取反,然後末尾+1,即0010 + 0001 = 0011,那麼1101 & 0011== 0001,很顯然得到m == 13二進位制末尾1的位置是2的0次方位,將13 - 0001 == 12,再對12執行lowbit操作,1100 & 0100 == 0100,也很輕易得到了m == 12時二進位制末尾1的位置是2的2次方位,將12 - 0100 == 8,再對8執行lowbit操作,0100 & 1100 == 0100,得到m == 8時二進位制位是2的2次方位,8 - 0100 == 0(結束操作),通過迴圈得到的13,12,8,則sum(13) == C13 + C12 + C8

求字首和的程式碼

int ans = 0;
int getSum(int m){
    while(m > 0){
        ans += C[m];
        m -= lowbit(m);
    }
}

對於n次字首和的查詢,時間複雜度為O(nlogn)
接下來講解單點更新值
對於輸入編號為x的值,要求為它的值附加一個value值,我們把圖再一次拿下來
圖3.jpg

假設x==2,value==5,那麼我們先找到A[2]的位置,通過觀察我們得知,如果修改了A[2]的值,那麼管轄A[2]的C[2],C[4],C[8]的字首和都要加上value(所有的祖先節點),那麼和查詢類似,我們如何得到C2的所有祖先節點呢(因為C2和A2的下標相同所以更新時查詢從C[x]開始),依舊是上述的巧妙的方法,但是我們把它倒過來
對於要更新x位置的值,我們把x轉換成二進位制,不斷對二進位制最後一個1的位置+1,直到達到陣列下標的最大值n結束

  • 對於給出的例子x==2,假設陣列下標上限n==8,x轉換成二進位制後等於0010(C2),對末尾1的位置進行+1,得到0100(C4),對末尾的1的位置進行+1,得到1000(C8),迴圈結束,對C2,C4,C8的字首和都要加上value,當然不能忘記對A[2]的值+value,單點更新值過程結束

給出程式碼

void update(int x, int value){
    A[x] += value;    //不能忘了對A陣列進行維護,盡善盡美嘛
    while(x <= n){
        C[x] += value;
        x += lowbit(x);
    }
}

對於n次更新操作,時間複雜度同樣為O(nlogn)

這裡有一個注意事項,我們對於求字首和與單點更新時,樹狀陣列C是拿來直接使用的,那麼問題來了,樹什麼時候建立好的,我怎麼不知道??

事實上,對於一個輸入的陣列A,我們一次讀取的過程,就可以想成是一個不斷更新值的過程(把A1~An從0更新成我們輸入的A[i]),所以一邊讀入A[i],一邊將C[i]涉及到的祖先節點值更新,完成輸入後樹狀陣列C也就建立成功了

  • 完整程式碼如下:
#include<stdio.h>
#include<string.h>

int a[10005];
int c[10005];
int n;

int lowbit(int x){
    return x&(-x);
}

int getSum(int x){
    int ans = 0;
    while(x > 0){
        ans += c[x];
        x -= lowbit(x);
    }
    return ans;
}

void update(int x, int value){
    a[x] += value;
    while(x <= n){
        c[x] += value;
        x += lowbit(x);
    }
}

int main(){
    while(scanf("%d", &n)!=EOF){    //用於測試n == 8 
        memset(a, 0, sizeof(a));
        memset(c, 0, sizeof(c));
        for(int i = 1; i <= n; i++){
            scanf("%d", &a[i]);     //a[i]的值根據具體題目自己安排測試可以1,2,3,4,5,6,7,8 
            update(i, a[i]);        //輸入的過程就是更新的過程 
        }
        int ans = getSum(n-1);      //用於測試輸出n-1的字首和 輸出28 
        printf("%d\n", ans);
    }   
    return 0;
} 

相關文章