Irwin-Hall 分佈學習筆記

CharlieVinnie發表於2023-05-01

定理:Irwin-Hall 分佈

對於 \(n\) 個在 \([0,1]\) 內均勻分佈的實數隨機變數,它們的和不超過一個實數 \(z\) 的機率為:

\[F(z)=\sum\limits_{k=0}^{\lfloor z\rfloor} (-1)^k\binom{n}{k}\frac{(z-k)^n}{n!} \]

證明:

首先明確一個概念:機率密度

對於一個隨機變數 \(X\)\([0,1]\)定義機率密度 \(\rho(x)\),使得對於任意 \(t\in[0,1]\),有 \(\int_{x=0}^t \rho(x)\mathrm{d}x=P(X\le t)\) 成立。如果令 \(f(t)=P(X\le t)\),那麼就有 \(\rho(t)=f'(t)\)

那麼對於 \(n\) 個隨機變數 \(X_1,X_2,\dots,X_n\),它們的和 \(\le z\) 的機率即為:

\[P(\sum X_i\le z)=\int\limits_{x_i\in[0,1],\sum x_i\le z}\prod \rho_i(x_i)\prod \mathrm{d}x_i \tag{1} \]

可以將機率密度理解為線段 \([0,1]\) 上密密地撒有很多很多帶權的小點,如果一個隨機變數 \(X_i\) 取到了點 \(x_i\),那麼它就會產生 \(\rho_i(x_i)\) 的權重。多個變數的權重即為每個變數單獨的權重之積。仔細理解一下這樣的定義是很合理的。

在 Irwin-Hall 分佈裡,所有隨機變數是均勻隨機的,所以 \(P(X\le t)=t\),於是求導即可得 \(\rho(t)=1\)

為了方便計算,我們將函式 \(\rho(x)\) 進行擴域。準確來說,原本的 \(\rho(x)\) 是定義在 \([0,1]\) 上的,這也可以視為當 \(x\notin [0,1]\)\(\rho(x)=0\);為了方便 \((1)\) 式的計算,我們令 \(\rho(x)=\rho'(x)-\rho''(x)\)(這裡不是求導),其中 \(\rho'(x)\)\(\rho''(x)\) 的函式表示式和 \(\rho(x)\) 完全相同,只是 \(\rho'(x)\) 改為定義在 \([0,+\infty)\) 上,\(\rho''(x)\) 改為定義在 \([1,+\infty)\) 上。這樣 \((1)\) 式的求和下標中上界就可以省去,有利於進一步的推導。

現在繼續對 \((1)\) 式的推導。

\[\begin{aligned} P(\sum X_i\le z)&=\int\limits_{x_i\in[0,1],\sum x_i\le z}\prod \rho_i(x_i)\prod \mathrm{d}x_i\\ &=\int\limits_{x_i\in[0,1],\sum x_i\le z}\prod (\rho'_i(x_i)-\rho''_i(x_i))\prod \mathrm{d}x_i\\ &=\sum\limits_{k}(-1)^k\binom{n}{k}\int\limits_{x_i\ge 0,\sum x_i\le z-k}\prod\limits_{i=1}^k \rho''_i(x_i+1) \prod\limits_{i=k+1}^n \rho'_i(x_i)\prod \mathrm{d}x_i \end{aligned} \tag{2} \]

式子中的 \(k\) 即列舉欽定了幾個變數是大於 \(1\) 的,然後進行容斥。

對於 Irwin-Hall 分佈來說,\(\prod\limits_{i=1}^k \rho''_i(x_i+1) \prod\limits_{i=k+1}^n \rho'_i(x_i)\) 恆為 \(1\),於是 \((2)\) 式即為:(注意下標中 \(x_i\) 之和 \(\le z-k\) 而非 \(z\)

\[\sum\limits_{k}(-1)^k\binom{n}{k}\int\limits_{x_i\ge 0,\sum x_i\le z-k}\prod \mathrm{d}x_i \tag{3} \]

考慮積分裡面的式子。我們將 \(\sum x_i\le z-k\) 視為在 \(z-k\) 內選出 \(n\) 個數 \(t_1\le t_2\le \dots \le t_n\),然後計算 \(\rho_1(t_1)\times\rho_2(t_2-t_1)\times\dots\times\rho_n(t_n-t_{n-1})=1\)。然後發現 \(t_1\le t_2\le \dots \le t_n\) 很煩,又發現貢獻係數和 \(t_i\) 的具體值毫無關係,於是可以直接變成 \(t_i\)\([0,z-k]\) 內任選,然後乘上一個 \(\frac{1}{n!}\) 的係數。於是 \((3)\) 式即為:

\[\sum\limits_{k=0}^{\lfloor z \rfloor}(-1)^k\binom{n}{k}\frac{(z-k)^n}{n!} \]

\(\mathrm{Q.E.D.}\)

相關文章