容斥原理講解

bigbigship發表於2014-08-15

對容斥原理的描述

容斥原理是一種重要的組合數學方法,可以讓你求解任意大小的集合,或者計算複合事件的概率。

描述

       容斥原理可以描述如下:

         要計算幾個集合並集的大小,我們要先將所有單個集合的大小計算出來,然後減去所有兩個集合相交的部分,再加回所有三個集合相交的部分,再減去所有四個集合相交的部分,依此類推,一直計算到所有集合相交的部分。

關於集合的原理公式

      上述描述的公式形式可以表示如下:
       

        

 

      它可以寫得更簡潔一些,我們將B作為所有Ai的集合,那麼容斥原理就變成了:

        

         這個公式是由 De Moivre (Abraham de Moivre)提出的。

關於維恩圖的原理

       用維恩圖來表示集合ABC

       

         那麼的面積就是集合ABC各自面積之和減去  的面積,再加上的面積。


         由此,我們也可以解決n個集合求並的問題。

關於概率論的原理

       設事件 代表發生某些事件的概率(即發生其中至少一個事件的概率),則:

  

         這個公式也可以用B代表Ai的集合:


容斥原理的證明

       我們要證明下面的等式:

       

         其中B代表全部Ai的集合

         我們需要證明在Ai集合中的任意元素,都由右邊的算式被正好加上了一次(注意如果是不在Ai集合中的元素,是不會出現在右邊的算式中的)。

         假設有一任意元素在kAi集合中(k>=1),我們來驗證這個元素正好被加了一次:

         size(C)=1時,元素x被加了k次。

         size(C)=2時,元素x被減了C(2,k)次,因為在k個集合中選擇2個,其中都包含x

         size(C)=3時,元素x被加了C(3,k)次。

         ……

         size(C)=k時,元素x被加/減了C(k,k)次,符號由sign(-1)^(k-1)決定。

         size(C)>k時,元素x不被考慮。

         然後我們來計算所有組合數的和。

         

         由二項式定理,我們可以將它變成

    

 

         我們把x取為1,這時表示1-T(其中Tx被加的總次數),所以,證明完畢。

對於實際問題的應用

       容斥原理的理論需要通過例子才能很好的理解。

         首先,我們用三個簡單的例子來闡釋這個理論。然後會討論一些複雜問題,試看如何用容斥原理來解決它們。

         其中的“尋找路徑數”是一個特殊的例子,它反映了容斥問題有時可以在多項式級複雜度內解決,不一定需要指數級。

一個簡單的排列問題

       09的數字組成排列,要求第一個數大於1,最後一個數小於8,一共有多少種排列?

         我們可以來計算它的逆問題,即第一個元素<=1或者最後一個元素>=8的情況。

         我們設第一個元素<=1時有X組排列,最後一個元素>=8時有Y組排列。那麼通過容斥原理來解決就可以寫成:

       

         經過簡單的組合運算,我們得到了結果:

         

         然後被總的排列數10!減,就是最終的答案了。

(0,1,2)序列問題

       長度為n的由數字012組成的序列,要求每個數字至少出現1次,這樣的序列有多少種?

         同樣的,我們轉向它的逆問題。也就是不出現這些數字的序列 不出現其中某些數字的序列。

         我們定義Ai(i=0…2)表示不出現數字i的序列數,那麼由容斥原理,我們得到該逆問題的結果為:


           可以發現每個Ai的值都為2^n(因為這些序列中只能包含兩種數字)。而所有的兩兩組合1(它們只包含1種數字)。最後,三個集合的交集為0。(因為它不包含數字,所以不存在)

        要記得我們解決的是它的逆問題,所以要用總數減掉,得到最終結果:

         

方程整數解問題

       給出一個方程:

       

         其中

        求這個方程的整數解有多少組。

        我們先不去理會xi<=8的條件,來考慮所有正整數解的情況。這個很容易用組合數來求解,我們要把20個元素分成6組,也就是新增5塊“夾板”,然後在25個位置中找5塊“夾板”的位置。

         

         然後通過容斥原理來討論它的逆問題,也就是x>=9時的解。

         我們定義Akxk>=9並且其他xi>=0時的集合,同樣我們用上面的新增“夾板”法來計算Ak的大小,因為有9個位置已經被xk所利用了,所以:

         

         然後計算兩個這樣的集合AkAp的交集:

         

         因為所有x的和不能超過20,所以三個或三個以上這樣的集合時是不能同時出現的,它們的交集都為0。最後我們用總數剪掉用容斥原理所求逆問題的答案,就得到了最終結果:

         

求指定區間內與n互素的數的個數:

       給出整數nr。求區間[1;r]中與n互素的數的個數。

         去解決它的逆問題,求不與n互素的數的個數。

         考慮n的所有素因子pi(i=1…k)

         [1;r]中有多少數能被pi整除呢?它就是:

       

         然而,如果我們單純將所有結果相加,會得到錯誤答案。有些數可能被統計多次(被好幾個素因子整除)。所以,我們要運用容斥原理來解決。

         我們可以用2^k的演算法求出所有的pi組合,然後計算每種組合的pi乘積,通過容斥原理來對結果進行加減處理。

         關於此問題的最終實現:

  1. int solve (int n, int r) {  
  2.   
  3.         vector<int> p;  
  4.   
  5.         for (int i=2; i*i<=n; ++i)  
  6.   
  7.                if (n % i == 0) {  
  8.   
  9.                        p.push_back (i);  
  10.   
  11.                        while (n % i == 0)  
  12.   
  13.                                n /= i;  
  14.   
  15.                }  
  16.   
  17.         if (n > 1)  
  18.   
  19.                p.push_back (n);  
  20.   
  21.    
  22.   
  23.         int sum = 0;  
  24.   
  25.         for (int msk=1; msk<(1<<p.size()); ++msk) {  
  26.   
  27.                int mult = 1,  
  28.   
  29.                        bits = 0;  
  30.   
  31.                for (int i=0; i<(int)p.size(); ++i)  
  32.   
  33.                        if (msk & (1<<i)) {  
  34.   
  35.                                ++bits;  
  36.   
  37.                                mult *= p[i];  
  38.   
  39.                        }  
  40.   
  41.    
  42.   
  43.                int cur = r / mult;  
  44.   
  45.                if (bits % 2 == 1)  
  46.   
  47.                        sum += cur;  
  48.   
  49.                else  
  50.   
  51.                        sum -= cur;  
  52.   
  53.         }  
  54.   
  55.    
  56.   
  57.         return r - sum;  
  58.   
  59. }  

演算法的複雜度為 

求在給定區間內,能被給定集合至少一個數整除的數個數

       給出n個整數ai和整數r。求在區間[1;r]中,至少能被一個ai整除的數有多少。

         解決此題的思路和上題差不多,計算ai所能組成的各種集合(這裡將集合中ai的最小公倍數作為除數)在區間中滿足的數的個數,然後利用容斥原理實現加減。

         此題中實現所有集合的列舉,需要2^n的複雜度,求解lcm需要O(nlogr)的複雜度。

能滿足一定數目匹配的字串的個數問題

       給出n個匹配串,它們長度相同,其中有一些’?’表示待匹配的字母。然後給出一個整數k,求能正好匹配k個匹配串的字串的個數。更進一步,求至少匹配k個匹配串的字串的個數。

         首先我們會發現,我們很容易找到能匹配所有匹配串的字串。只需要對比所有匹配串,去在每一列中找出現的字母(或者這一列全是’?’,或者這一列出現了唯一的字母,否則這樣的字串就存在),最後所有字母組成的單詞即為所求。

         現在我們來學習如何解決第一個問題:能正好匹配k個匹配串的字串。

         我們在n個匹配串中選出k個,作為集合X,統計滿足集合X中匹配的字串數。求解這個問題時應用容斥原理,對X的所有超集進行運算,得到每個X集合的結果:

       

         此處f(Y)代表滿足匹配集合Y的字串數。

         如果我們將所有的ans(X)相加,就可以得到最終結果:

         

         這樣,就得到了一個複雜度的解法。

        這個演算法可以作一些改進,因為在求解ans(X)時有些Y集合是重複的。

         回到利用容斥原理公式可以發現,當選定一個Y時,所有 X的結果都是相同的,其符號都為。所以可以用如下公式求解:

         

        這樣就得到了一個複雜度的解法。

        現在我們來求解第二個問題:能滿足至少k個匹配的字串有多少個。

        顯然的,我們可以用問題一的方法來計算滿足kn的所有結果。問題一的結論依然成立,不同之處在於這個問題中的X不是大小都為k的,而是>=k的所有集合。

        如此進行計算,最後將f(Y)作為另一個因子:將所有的ans做和,有點類似二項式展開:


在《具體數學》( Graham, Knuth, Patashnik. "Concrete Mathematics" [1998] )中,介紹了一個著名的關於二項式係數的公式:


根據這個公式,可以將前面的結果進行化簡:


那麼,對於這個問題,我們也得到了一個的解法:


路徑的數目問題

       在一個方格陣中,有k個格子是不可穿越的牆。一開始在格子(1,1)(最左下角的格子)中有一個機器人。這個機器人只能向上或向右行進,最後它將到達位於格子(n,m)的籠子裡,其間不能經過障礙物格子。求一共有多少種路線可以到達終點。

         為了方便區分所有障礙物格子,我們建立座標系,用(x,y)表示格子的座標。

         首先我們考慮沒有障礙物的時候:也就是如何求從一個點到另一個點的路徑數。如果從一個點在一個方向要走x個格子,在另一個方向要走y個格子,那麼通過簡單的組合原理可以得知結果為:

         

         現在來考慮有障礙物時的情況,我們可以利用容斥原理:求出至少經過一個障礙物時的路徑數。

         對於這個例子,你可以列舉所有障礙物的子集,作為需要要經過的,計算經過該集合障礙物的路徑數(求從原點到第一個障礙物的路徑數、第一個障礙物到第二個障礙物的路徑數最後對這些路徑數求乘積),然後通過容斥原理,對這些結果作加法或減法。

         然而,它是一個非多項式的解法,複雜度。下面我們將介紹一個多項式的解法

         我們運用動態規劃:令d[i][j]代表從第i個點到第j個點,不經過任何障礙物時的路徑數(當然除了ij)。那麼我們總共需要k+2個點,包括k個障礙物點以及起點和終點。

         首先我們算出從i點到j點的所有路徑數,然後減掉經過障礙物的那些“壞”的路線。讓我們看看如何計算“壞”的路線:列舉ij之間的所有障礙物點i<l<j,那麼從ij的“壞”路徑數就是所有d[i][l]d[l][j]的乘積最後求和。再被總路徑數減掉就是d[i][j]的結果。

         我們已經知道計算總路徑數的複雜度為 ,那麼該解法的總複雜度為 

 

        (譯註:當然也有O(nm)dp解法,根據nmk的值可以採取適當的解法)

 素數四元組的個數問題

       給出n個數,從其中選出4個數,使它們的最大公約數為1,問總共有多少中取法。

        我們解決它的逆問題:求最大公約數d>1的四元組的個數。

        運用容斥原理,將求得的對於每個d的四元組個數的結果進行加減。

         

         其中deg(d)代表d的質因子個數,f(d)代表四個數都能被d整除的四元組的個數。

         求解f(d)時,只需要利用組合方法,求從所有滿足被d整除的ai中選4個的方法數。

         然後利用容斥原理,統計出所有能被一個素數整除的四元組個數,然後減掉所有能被兩個素數整除的四元組個數,再加上被三個素數整除的四元組個數

和睦數三元組的個數問題

       給出一個整數 。選出a, b, c (其中2<=a<b<c<=n),組成和睦三元組,即:

         · 或者滿足    

·或者滿足

首先,我們考慮它的逆問題:也就是不和睦三元組的個數。

然後,我們可以發現,在每個不和睦三元組的三個元素中,我們都能找到正好兩個元素滿足:它與一個元素互素,並且與另一個元素不互素。

所以,我們只需列舉2n的所有數,將每個數的與其互素的數的個數和與其不互素的數的個數相乘,最後求和併除以2,就是要求的逆問題的答案。

現在我們要考慮這個問題,如何求與2n這些數互素(不互素)的數的個數。雖然求解與一個數互素數的個數的解法在前面已經提到過了,但在此並不合適,因為現在要求2n所有數的結果,分別求解顯然效率太低。

所以,我們需要一個更快的演算法,可以一次算出2n所有數的結果。

在這裡,我們可以使用改進的埃拉托色尼篩法

·首先,對於2n的所有數,我們要知道構成它的素數中是否有次數大於1的,為了應用容斥原理,我們還有知道它們由多少種不同的素數構成。

對於這個問題,我們定義陣列deg[i]:表示i由多少種不同素數構成,以及good[i]:取值truefalse,表示i包含素數的次數小於等於1是否成立。

再利用埃拉托色尼篩法,在遍歷到某個素數i時,列舉它在2n範圍內的所有倍數,更新這些倍數的deg[]值,如果有倍數包含了多個i,那麼就把這個倍數的good[]值賦為false

·然後,利用容斥原理,求出2n每個數的cnt[i]:在2n中不與i互素的數的個數。

回想容斥原理的公式,它所求的集合是不會包含重複元素的。也就是如果這個集合包含的某個素數多於一次,它們不應再被考慮。

所以只有當一個數i滿足good[i]=true時,它才會被用於容斥原理。列舉i的所有倍數i*j,那麼對於i*j,就有N/i個與i*j同樣包含i(素數集合)的數。將這些結果進行加減,符號由deg[i](素數集合的大小)決定。如果deg[i]為奇數,那麼我們要用加號,否則用減號。

程式實現:

  1. int n;  
  2.   
  3. bool good[MAXN];  
  4.   
  5. int deg[MAXN], cnt[MAXN];  
  6.   
  7.    
  8.   
  9. long long solve() {  
  10.   
  11.          memset (good, 1, sizeof good);  
  12.   
  13.          memset (deg, 0, sizeof deg);  
  14.   
  15.          memset (cnt, 0, sizeof cnt);  
  16.   
  17.    
  18.   
  19.          long long ans_bad = 0;  
  20.   
  21.          for (int i=2; i<=n; ++i) {  
  22.   
  23.                  if (good[i]) {  
  24.   
  25.                           if (deg[i] == 0) deg[i] = 1;  
  26.   
  27.                           for (int j=1; i*j<=n; ++j) {  
  28.   
  29.                                    if (j > 1 && deg[i] == 1)  
  30.   
  31.                                             if (j % i == 0)  
  32.   
  33.                                                     good[i*j] = false;  
  34.   
  35.                                             else  
  36.   
  37.                                                     ++deg[i*j];  
  38.   
  39.                                    cnt[i*j] += (n / i) * (deg[i]%2==1 ? +1 : -1);  
  40.   
  41.                           }  
  42.   
  43.                  }  
  44.   
  45.                  ans_bad += (cnt[i] - 1) * 1ll * (n - cnt[i] - 1);  
  46.   
  47.          }  
  48.   
  49.          return (n-1) * 1ll * (n-2) * (n-3) / 6 - ans_bad / 2;  
  50.   
  51. }  

最終演算法的複雜度為 ,因為對於大部分i都要進行n/i次列舉。

錯排問題

       我們想要證明如下的求解長度為n序列的錯排數的公式:

      

         它的近似結果為:

         

         (此外,如果將這個近似式的結果向其最近的整數舍入,你就可以得到準確結果)

         我們定義Ak:在長度為n的序列中,有一個不動點位置為k(1<=k<=n)時的序列集合。

         現在我們運用容斥原理來計算至少包含有一個不動點的排列數,要計算這個,我們必須先算出所有Ak、以及它們的交集的排列數。




因為我們知道當有x個不動點時,所有不動點的位置是固定的,而其它點可以任意排列。

用容斥原理對結果進行帶入,而從n個點中選x個不動點的組合數為,那麼至少包含一個不動點的排列數為:


那麼不包含不動點(即錯排數)的結果就是:


化簡這個式子,我們得到了錯排數的準確式和近似式:


(因為括號中是泰勒展開式的前n+1項)

用這個式子也可以解決一些類似的問題,如果現在求有m個不動點的排列數,那麼我們可以對上式進行修改,也就是將括號中的累加到1/n!改成累加到1/(n-m)!

題目描述

1n範圍內能被568整除的數的個數。(0<n<10^7輸入

多組資料,處理到檔案結尾。

每行輸入一個n

輸出

 

輸出結果,每個結果佔一行。

示例輸入

1000

示例輸出

400

程式碼:
  1. #include <iostream>    
  2.    #include<cstdio>    
  3.    #include<cstring>    
  4.    #include<algorithm>    
  5.    using namespace std;    
  6.    int main()    
  7.    {    
  8.        int i,j,k,n,b,a;    
  9.        while(cin>>n)    
  10.        {    
  11.            b = n/30+n/24+n/40;    
  12.        a = n/120;    
  13.        k = n/5+n/6+n/8;    
  14.        cout<<k-b+a<<endl;    
  15.        }    
  16.        
  17.        return 0;    
  18.    }    


OJ的相關題目

這裡列出了一些可以用容斥原理解決的習題。 
· UVA #10325 "The Lottery" [難度:簡單]

· UVA #11806 "Cheerleaders" [難度:簡單]

· TopCoder SRM 477 "CarelessSecretary" [難度:簡單]

· TopCoder TCHS 16 "Divisibility" [難度:簡單]

· SPOJ #6285 NGM2 "Another Game With Numbers" [難度:簡單]

· TopCoder SRM 382 "CharmingTicketsEasy" [難度:中等]

· TopCoder SRM 390 "SetOfPatterns"  [難度:中等]

· TopCoder SRM 176 "Deranged" [難度:中等]

· TopCoder SRM 457 "TheHexagonsDivOne" [難度:中等]

· SPOJ #4191 MSKYCODE "Sky Code" [難度:中等]

· SPOJ #4168 SQFREE "Square-free integers" [難度:中等]

· CodeChef "Count Relations" [難度:中等]

      

參考文獻

       Debra K. Borkovitz. "Derangements and the Inclusion-Exclusion Principle"

相關文章