- 三大分佈密度函式推導
- 第六節\(\chi^{2}\)分佈、t分佈和F分佈密度的推導
- 一、\(\chi^{2}\)分佈密度的推導
- 二、t分佈密度的推導
- 三、F分佈密度的推導
三大分佈密度函式推導
下面方程的解\(\sum_{j=v}^{n} C_{n}^{i} \underline{p}'(1-\underline{p})^{n-1}=\alpha / 2\),\(\sum_{j=0}^{\infty} C_{n}' \overline{p}'(1-\overline{p})^{n-i}=\alpha / 2\),其中r為實際觀察值,可以指出\(p=r\left[(n-r+1) F_{2(n-r+1), 2 r}(\alpha / 2)+r\right]^{-1} \quad(3.51)\),\(\overline{p}= (r+1) F_{2(r+1), 2(n-r)}(\alpha / 2)[n-r+(r+1) F_{2(r+1), 2(n-r)}(\alpha / 2)]^{-1}. \quad(3.52)\)。
例3.16從某批產品中隨機地抽了20個樣品,發現其中有6個是次品,求這批產品其次品率的區間估計\((\alpha=10 \%)\)。解由公式(3.51)和(3.52)得\(\underline{p}=6\left[(20-6+1) F_{30,12}(0.05)+6\right]^{-1}=0.139\),\(\overline{p} =(6+1) F_{14,28}(0.05)\left[20-6+(6+1) F_{14,28}(0.05)\right]^{-1}=0.507\),次品率p的區間估計為(0.139,0.507)。
第六節\(\chi^{2}\)分佈、t分佈和F分佈密度的推導
前三節我們已分別介紹了\(\chi^{2}\)分佈、t分佈和F分佈的定義、性質和應用,但是沒有匯出它們的分佈密度,因為在推導過程中需要用到較多的數學知識,對於許多實際工作者,不一定需要花許多時間來弄清它們密度的來源,故我們把這部分內容抽出來單獨闢為一節,沒有興趣的同志可以跳過此節。
一、\(\chi^{2}\)分佈密度的推導
令\(Y_{1}, \cdots, Y_{n}\),獨立同分布,且\(Y,\)服從標準正態分佈\(N(0,1)\),由定義3.3,\(X=Y_{1}^{2}+\cdots+Y_{n}^{2} \sim \chi_{n}^{2}\)。運用例1.18中使用的典型手法,令\(h(x)\)為任一非負函式,使得\(h(X)\)為一隨機變數,則\(E[h(X)]=\int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} h\left(y_{1}^{2}+\cdots+y_{n}^{2}\right)\left(\frac{1}{\sqrt{2 \pi}}\right)^{n} \cdot e^{-\frac{1}{2}\left(y_{1}^{2}+\cdots+y_{n}^{2}\right)} d y_{1} \cdots d y_{n}\)。作多維球座標變換:
\(\begin{cases}y_{1}=r \cos \theta_{1} \\ y_{2}=r \sin \theta_{1} \cos \theta_{2} \\ y_{3}=r \sin \theta_{1} \sin \theta_{2} \cos \theta_{3} & 0 \leq r<\infty \\ \cdots \cdots & 0 \leq \theta_{i} \leq \pi, i=1, \cdots, n-2 \\ y_{n-1}=r \sin \theta_{1} \cdots \sin \theta_{n-2} \cos \theta_{n-1} & 0 \leq \theta_{n-1} \leq 2 \pi \\ y_{n}=r \sin \theta_{1} \cdots \sin \theta_{n-2} \sin \theta_{n-1} \end{cases}\)。
為了求這個變換的雅可比行列式,直接按定義計算並非是輕而易舉之事。求這個行列式有三種計算方法:一種是微積分學教程第三卷第二分冊(人民教育出版社,1964,第411 - 412頁)介紹的方法,技巧性較高;另一種方法是對n用歸納法來求,方法簡單;第三種方法是用矩陣微商的方法,把n個變元之間的雅可比行列式化為n個一元函式之雅可比的乘積(見“多元分析資料彙編”,中國科學院應用數學研究所機率統計諮詢服務部,1983,第105頁),鑑於本書的性質,這裡不準備給出證明。變換的雅可比行列式為\(J=r^{n-1} \sin ^{n-2} \theta_{1} \sin ^{n-3} \theta_{2} \cdots \sin ^{2} \theta_{n-3} \sin \theta_{n-2} \quad(3.54)\)。
其實,我們可以避開直接求(3.54)的矛盾,由定義有\(J=\left|\begin{array}{ccc} \frac{\partial y_{1}}{\partial r} & \frac{\partial y_{1}}{\partial \theta_{1}} & \cdots & \frac{\partial y_{1}}{\partial \theta_{n-1}} \\ \vdots & \vdots & \vdots \\ \frac{\partial y_{n}}{\partial r} & \frac{\partial y_{n}}{\partial \theta_{1}} & \cdots & \frac{\partial y_{n}}{\partial \theta_{n-1}}\end{array}\right|_{+}=r^{n-1} c\),因為其中從第二列開始直至最後一列,每列均可提出一個因子r,將r提出後剩餘部分僅與\(\theta_{1}, \cdots \theta_{n-1}\)有關,記成c,由此\(E[h(X)]=\int_{0}^{\infty} d r \int_{0}^{\pi} \cdots \int_{0}^{\pi} d \theta_{1} \cdots d \theta_{n-2} \int_{0}^{2 \pi} h\left(r^{2}\right)\left(\frac{1}{\sqrt{2 \pi}}\right)^{n} \cdot e^{-\frac{1}{2} r^{2}} r^{n-1} c d \theta_{n-1}=c' \int_{0}^{\infty} h\left(r^{2}\right) r^{n-1} e^{-\frac{1}{2} r^{2}} d r \quad\left(c'\right.\)為常數\()=c'' \int_{0}^{\infty} h(u) u^{\frac{n}{2}-1} e^{-\frac{1}{2} u} d u \quad\left(c''\right.\)為常數\()\),故X的分佈密度為。
為了求\(c''\),應有\(c'' x^{\frac{n}{2}-1} e^{-\frac{1}{2} x}\),\(1 =c'' \int_{0}^{\infty} x^{\frac{n}{2}-1} e^{-\frac{1}{2} x} d x \quad(=c'' 2^{n / 2} \int_{0}^{\infty} y^{\frac{n}{2}-1} e^{-y} d y=c'' 2^{n / 2} \Gamma(n / 2)\),即\(c''=(2^{n / 2} \Gamma(n / 2))^{-1}\),這就證明了(3.20)式。
推導(3.20)式還可以直接用歸納法,主要利用以下幾件事實:
(1)由例1.18知\(\chi^{2}\)的分佈密度為\(\frac{1}{\sqrt{2 \pi}} x^{-1 / 2} e^{-x / 2}\);
(2)若隨機變數X和Y獨立,各有分佈密度\(f_{1}(x)\)和\(f_{2}(y)\),則\(Z=X+Y\)有分佈密度\(f(z)=\int_{-\infty}^{\infty} f_{1}(z-x) f_{2}(x) d x\);
(3)利用上面兩個事實對n作歸納法便可匯出(3.20)式,其中用到貝塔函式的簡單性質。
有興趣的讀者可以去試試看,此外,在文獻[22]第九章還給出了\(\chi^{2}\)分佈的其它推導法。
二、t分佈密度的推導
設\(X \sim N(0,1)\)與\(Y \sim \chi_{n}^{2}\)獨立,則隨機變數\(T=\frac{\sqrt{n} X}{\sqrt{Y}}\)的分佈是具有n個自由度的t分佈。由假設條件可知X和Y的聯合分佈密度是\(C_{n} e^{-x^{2} / 2} e^{-y / 2} y^{n / 2-1}\),其中\(C_{n}=\frac{1}{\sqrt{2 \pi} 2^{n / 2} \Gamma(n / 2)}\)。令\(h(t)\)為任一非負函式使得\(h(T)\)為一隨機變數,於是\(E[h(T)]=C_{n} \int_{-\infty}^{\infty} d x \int_{0}^{\infty} h(\frac{\sqrt{n} x}{\sqrt{y}}) e^{-x^{2} / 2} e^{-y / 2} y^{n / 2-1} d y\)。
作變換\(\left\{\begin{array} { l = \sqrt { n x } / \sqrt { y } \\ y = y \end{array} \quad\right.\)或\(\left\{\begin{array}{l}x=\sqrt{y} t / \sqrt{n} \\ y=y\end{array}\right.\),則變換的雅可比行列式是\(J=\left|\begin{array}{ll} \frac{\partial x}{\partial t} & \frac{\partial x}{\partial y} \\ \frac{\partial y}{\partial t} & \frac{\partial y}{\partial y}\end{array}\right|_{+}=\left|\begin{array}{cc} \sqrt{y} / \sqrt{n} & \frac{1}{2} t y^{-1 / 2} / \sqrt{n} \\ 0 & 1 \end{array}\right|_{+}=\sqrt{y / n}\),代入得\(E[h(T)]=C_{n} \int_{-\infty}^{\infty} h(t) d t \int_{0}^{\infty} e^{-y t^{2} / 2 n} e^{-y / 2} y^{n / 2-1} \sqrt{y / n} d y\)。上式右端第二重積分是\((1 / \sqrt{n})\)乘以\(\int_{0}^{\infty} y^{(n-1) / 2} e^{-\frac{y}{2}\left(1+\frac{t^{2}}{n}\right)} d y \quad\left(\& \leftrightarrow z=\left(1+\frac{t^{2}}{n}\right) y\right)=\int_{0}^{\infty}\left(1+\frac{t^{2}}{n}\right)^{-(n-1) / 2} z^{(n-1) / 2} e^{-z / 2}\left(1+\frac{t^{2}}{n}\right)^{-1} d z=\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} \int_{0}^{\infty} z^{(n+1) / 2-1} e^{-z / 2} d z=\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} \Gamma\left(\frac{n+1}{2}\right) 2^{(n+1) / 2}\)。
上面最後一步利用了積分號內的函式是\(\chi^{2}_{n+1}\)的分佈密度(差一個常數),將結果代入到(3.55)中去,得\(E[h(T)]=C_{n}\left(\frac{1}{\sqrt{n}}\right) \Gamma\left(\frac{n+1}{2}\right) 2^{(n+1) / 2} \int_{-\infty}^{\infty} h(t) \cdot\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} d t=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n \pi} \Gamma\left(\frac{n}{2}\right)} \int_{-\infty}^{\infty} h(t)\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} d t\),這就證明了(3,32)式。
三、F分佈密度的推導
設\(X \sim \chi_{m}^{2}\)與\(Y \sim \chi_{n}^{2}\)獨立,則\(F=\frac{(n / m)(X / Y)}\)的分佈是自由度為m和n的F分佈,由假設條件知X和Y的聯合密度為\(C_{m, n} x^{\frac{m}{2}-1} y^{\frac{n}{2}-1} e^{-\frac{1}{2}(x+y)}\),其中\(C_{m, n}^{-1}=2^{(n+m) / 2} \Gamma(m / 2) \Gamma(n / 2)\)。令\(h(f)\)為任一非負函式使得\(h(F)\)為隨機變數,於是\(E[h(F)]=\int_{0}^{\infty} \int_{0}^{\infty} h\left(\frac{n}{m} \frac{x}{y}\right) C_{m, n} x^{m / 2-1} y^{n / 2-1} e^{-(x+y) / 2} d x d y\)。
作變換\(\left\{\begin{array}{l}f=\frac{n}{m} \frac{x}{y} \\ y=y\end{array}\right.\)或\(\left\{\begin{array}{l}x=\frac{m}{n} f y \\ y=y\end{array}\right.\),則變換的雅可比行列式為\((m / n) y\),於是\(E[h(F)]=C_{m, n} \int_{0}^{\infty} h(f) d f \int_{0}^{\infty}\left(\frac{m}{n} f y\right)^{m / 2-1} y^{n / 2-1} \cdot e^{-\frac{y}{2}\left(1+\frac{m}{n} f\right)}\left(\frac{m}{n} y\right) d y=C_{m, n}\left(\frac{m}{n}\right)^{m / 2} \int_{0}^{\infty} h(f) f^{m / 2-1} \int_{0}^{\infty} y^{(m+n) / 2-1} \cdot e^{-\frac{y}{2}\left(1+\frac{m}{n} f\right)} d y\)。
令\(z=(1+\frac{m}{n} f) y\),上式右邊第二重積分為\(\int_{0}^{\infty}\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} z^{(m+n) / 2-1} e^{-z / 2} d z=\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} \Gamma\left(\frac{m+n}{2}\right) 2^{(m+n) / 2}\),因此\(E[h(F)]=\frac{1}{B\left(\frac{m}{2}, \frac{n}{2}\right)}\left(\frac{m}{n}\right)^{m / 2} \int_{0}^{\infty} h(t) f^{m / 2-1} \cdot\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} d f\),這就證明了(3.38)式。