定理:Irwin-Hall 分佈
對於 \(n\) 個在 \([0,1]\) 內均勻分佈的實數隨機變數,它們的和不超過一個實數 \(z\) 的機率為:
證明:
首先明確一個概念:機率密度。
對於一個隨機變數 \(X\),在 \([0,1]\) 上定義機率密度 \(\rho(x)\),使得對於任意 \(t\in[0,1]\),有 \(\int_{x=0}^t \rho(x)\mathrm{d}x=P(X\le t)\) 成立。如果令 \(f(t)=P(X\le t)\),那麼就有 \(\rho(t)=f'(t)\)。
那麼對於 \(n\) 個隨機變數 \(X_1,X_2,\dots,X_n\),它們的和 \(\le z\) 的機率即為:
可以將機率密度理解為線段 \([0,1]\) 上密密地撒有很多很多帶權的小點,如果一個隨機變數 \(X_i\) 取到了點 \(x_i\),那麼它就會產生 \(\rho_i(x_i)\) 的權重。多個變數的權重即為每個變數單獨的權重之積。仔細理解一下這樣的定義是很合理的。
在 Irwin-Hall 分佈裡,所有隨機變數是均勻隨機的,所以 \(P(X\le t)=t\),於是求導即可得 \(\rho(t)=1\)。
為了方便計算,我們將函式 \(\rho(x)\) 進行擴域。準確來說,原本的 \(\rho(x)\) 是定義在 \([0,1]\) 上的,這也可以視為當 \(x\notin [0,1]\) 時 \(\rho(x)=0\);為了方便 \((1)\) 式的計算,我們令 \(\rho(x)=\rho'(x)-\rho''(x)\)(這裡不是求導),其中 \(\rho'(x)\) 和 \(\rho''(x)\) 的函式表示式和 \(\rho(x)\) 完全相同,只是 \(\rho'(x)\) 改為定義在 \([0,+\infty)\) 上,\(\rho''(x)\) 改為定義在 \([1,+\infty)\) 上。這樣 \((1)\) 式的求和下標中上界就可以省去,有利於進一步的推導。
現在繼續對 \((1)\) 式的推導。
式子中的 \(k\) 即列舉欽定了幾個變數是大於 \(1\) 的,然後進行容斥。
對於 Irwin-Hall 分佈來說,\(\prod\limits_{i=1}^k \rho''_i(x_i+1) \prod\limits_{i=k+1}^n \rho'_i(x_i)\) 恆為 \(1\),於是 \((2)\) 式即為:(注意下標中 \(x_i\) 之和 \(\le z-k\) 而非 \(z\))
考慮積分裡面的式子。我們將 \(\sum x_i\le z-k\) 視為在 \(z-k\) 內選出 \(n\) 個數 \(t_1\le t_2\le \dots \le t_n\),然後計算 \(\rho_1(t_1)\times\rho_2(t_2-t_1)\times\dots\times\rho_n(t_n-t_{n-1})=1\)。然後發現 \(t_1\le t_2\le \dots \le t_n\) 很煩,又發現貢獻係數和 \(t_i\) 的具體值毫無關係,於是可以直接變成 \(t_i\) 在 \([0,z-k]\) 內任選,然後乘上一個 \(\frac{1}{n!}\) 的係數。於是 \((3)\) 式即為:
\(\mathrm{Q.E.D.}\)