[概統]本科二年級 概率論與數理統計 第二講 幾何概型

一個不願透露姓名的孩子發表於2020-12-20

[概統]本科二年級 概率論與數理統計 第二講 幾何概型

幾何概型的思想非常簡單,用圖形表示事件,某個事件的概率就等於事件對應的圖形面積除以所有可能的事件對應的圖形面積。幾何概型可以理解成古典概型的幾何表示,點表示基本事件,相比古典概型只能處理有限的情況,幾何概型的進步性在於它可以處理基本事件總數無限的情況。這一講將介紹兩個幾何概型名題,作為高中概率論到本科概率論的過渡。

蒲豐投針問題 Buffon’s Needle Problem

這個問題是1777年由蒲豐提出,這是一種用來估計圓周率的概率方法。蒲豐設計的投針試驗步驟如下:

  1. 取一張白紙,在上面畫上許多條間距為 a a a的平行線;
  2. 取一根長度為 l ( l ≤ a ) l (l \le a) l(la)的針,隨機地向畫有平行直線的紙上擲 n n n次,觀察針與直線相交的次數,記為 m m m
  3. 計算針與直線相交的理論概率 p p p,則當試驗次數足夠多時, p = m / n p=m/n p=m/n

下面我們計算一下投一根針的情況下它與直線相交的理論概率,然後推導估計圓周率的公式。

考慮一族平行線, y = k a , k ∈ Z y=ka,k \in \mathbb{Z} y=ka,kZ,我們需要一些變數描述針的位置,因為針的長度是已知的,平行線的方程與 x x x座標無關,不失一般性,我們假設端點的縱座標為 y 0 y_0 y0,針與平行線構成的夾角為 θ \theta θ,則 y 0 ∈ ( 0 , a ] , θ ∈ [ 0 , π / 2 ] y_0 \in (0,a],\theta \in [0,\pi/2] y0(0,a],θ[0,π/2],因此所有的基本事件可以用集合 Ω \Omega Ω表示:
Ω = { ( y 0 , θ ) : y 0 ∈ ( 0 , a ] , θ ∈ [ 0 , π / 2 ] } \Omega = \{(y_0,\theta):y_0 \in (0,a],\theta \in [0,\pi/2]\} Ω={(y0,θ):y0(0,a],θ[0,π/2]}

現在考慮針與平行線相交的條件,
y 0 + l sin ⁡ θ ≥ a y_0+l\sin \theta \ge a y0+lsinθa

於是針與平行線相交的事件為 A A A
A = { ( y 0 , θ ) : y 0 ∈ ( 0 , a ] , θ ∈ [ 0 , π / 2 ] , y 0 + l sin ⁡ θ ≥ a } A=\{(y_0,\theta):y_0 \in (0,a],\theta \in [0,\pi/2],y_0+l\sin \theta \ge a\} A={(y0,θ):y0(0,a],θ[0,π/2],y0+lsinθa}

因此
p = ∣ A ∣ ∣ Ω ∣ = ∬ A d y 0 d θ π a 2 p = \frac{|A|}{|\Omega|} = \frac{\iint_{A}dy_0d\theta}{\frac{\pi a}{2}} p=ΩA=2πaAdy0dθ

我們計算積分,根據Fubini定理
∬ A d y 0 d θ = ∫ 0 π / 2 ∫ a − l sin ⁡ θ a d y 0 d θ = ∫ 0 π / 2 l sin ⁡ θ d θ = l \iint_{A}dy_0d\theta = \int_0^{\pi/2}\int_{a-l\sin \theta}^ady_0d\theta \\ = \int_0^{\pi/2}l\sin \theta d \theta = l Ady0dθ=0π/2alsinθady0dθ=0π/2lsinθdθ=l

所以
p = 2 l π a = m n ⇒ π = 2 n l m a p=\frac{2l}{\pi a} = \frac{m}{n} \Rightarrow \pi = \frac{2nl}{ma} p=πa2l=nmπ=ma2nl

蒲豐投針問題在眾多幾何概型問題中脫穎而出的原因是它是最早把幾何概型作為工具試圖解決其他問題的例子。

伯川德悖論 Bertrand Paradox

伯川德悖論是伯川德在1889年提出來的,這個悖論最核心的思路在於用來描述基本事件的座標系不一樣,計算出來的積分結果會不一樣,這就導致同一個事件會有不一樣的概率,然而這個悖論在有了微分同胚與積分換元公式之後就自然解決了。

伯川德悖論想討論的是在一個圓中任選一條弦,要計算這根弦的長度超過半徑的概率,他提出了三種概率不同的解法:

方法一 隨機端點法
我們固定一個端點,然後讓另一個端點在圓周上任意運動,連線這兩個端點就得到了一條弦,過這個固定的端點只有一個一條直徑,過這個端點可以做與這條直徑垂直的直線,考慮這條線與弦構成的圓周角,記為 θ \theta θ,則 θ ∈ [ 0 , π ] \theta \in [0,\pi] θ[0,π],當 θ ∈ [ π / 6 , 5 π / 6 ] \theta \in [\pi/6,5\pi/6] θ[π/6,5π/6]時,弦長不小於半徑,於是概率為 2 / 3 2/3 2/3
在這裡插入圖片描述

方法二 隨機徑向法
對於任意的弦,總是可以找到一個半徑與其垂直,於是我們固定一個半徑,考慮與它垂直的弦,記垂足與圓心的距離為 x x x,則 x ∈ [ 0 , r ] x \in [0,r] x[0,r],這裡 r r r表示半徑長度,顯然當 x ≤ 3 r / 2 x \le \sqrt{3}r/2 x3 r/2時,弦長大於半徑,於是概率為 3 / 2 \sqrt{3}/2 3 /2

在這裡插入圖片描述

方法三 隨機中點法

我們考慮中點的位置,它可以是圓內任意一個點,要使弦長大於半徑,需要中點距離圓心的位置不大於半徑的 3 / 2 \sqrt{3}/2 3 /2,因此概率為 3 / 4 3/4 3/4

在這裡插入圖片描述


根據上文的敘述,我們發現試驗時選擇的描述隨機性的變數不同,得到的概率也不同,所以古典概型這個理論體系是有缺陷的。我們來簡單分析一下缺陷發生的原因。

下面假設圓的方程為 x 2 + y 2 = r 2 x^2+y^2=r^2 x2+y2=r2

方法一 隨機端點法
還是考慮固定一個端點,將其座標設定為 ( 0 , − r ) (0,-r) (0,r),用 s s s表示另一個端點到固定端點的較短的弧的弧長,則 s ∈ ( 0 , π r ] s \in (0,\pi r] s(0,πr],用 Ω \Omega Ω表示所有的基本事件,則
Ω = { s : s ∈ ( 0 , π r ] } \Omega = \{s:s \in (0,\pi r]\} Ω={s:s(0,πr]}

我們可以把弦長用 s s s表示為
2 r sin ⁡ s r 2r\sin \frac{s}{r} 2rsinrs

A A A表示弦長大於半徑的事件,
A = { s : 2 r sin ⁡ s r ≥ r } A=\{s:2r\sin \frac{s}{r} \ge r\} A={s:2rsinrsr}

於是概率為
p 1 = ∣ A ∣ ∣ Ω ∣ = ∫ A d s ∫ Ω d s p_1 = \frac{|A|}{|\Omega|} =\frac{\int_A ds}{\int_{\Omega} ds} p1=ΩA=ΩdsAds

方法二 隨機徑向法
我們考慮 ( 0 , − r ) (0,-r) (0,r)與原點為端點的半徑,用 x x x表示從原點到與這條半徑垂直的弦的垂足的距離,則
Ω = { x : x ∈ [ 0 , r ) } \Omega = \{x:x \in [0,r)\} Ω={x:x[0,r)}

弦長可以用 x x x表示,
2 r 2 − x 2 2\sqrt{r^2-x^2} 2r2x2

A A A表示弦長大於半徑的事件,
A = { x : 2 r 2 − x 2 ≥ r } A=\{x:2\sqrt{r^2-x^2} \ge r\} A={x:2r2x2 r}

於是概率為
p 2 = ∣ A ∣ ∣ Ω ∣ = ∫ A d x ∫ Ω d x p_2 = \frac{|A|}{|\Omega|} = \frac{\int_A dx}{\int_{\Omega} dx} p2=ΩA=ΩdxAdx

方法三 隨機中點法
( x , y ) (x,y) (x,y)表示中點座標,則
Ω = { ( x , y ) : x 2 + y 2 ≤ r 2 } \Omega = \{(x,y):x^2+y^2 \le r^2\} Ω={(x,y):x2+y2r2}

A A A表示弦長大於半徑的事件,
A = { ( x , y ) : x 2 + y 2 ≤ r 2 / 4 } A=\{(x,y):x^2+y^2 \le r^2/4\} A={(x,y):x2+y2r2/4}

於是概率為
p 3 = ∣ A ∣ ∣ Ω ∣ = ∬ A d x d y ∬ Ω d x d y p_3 = \frac{|A|}{|\Omega|} = \frac{\iint_A dxdy}{\iint_{\Omega} dxdy} p3=ΩA=ΩdxdyAdxdy

現在我們用比較專業的寫法重新敘述了三種方法,如果按照現在的公式積分積出來會得到和Bertrand一樣的結果,接下來我們考慮這種不同座標建立方式之間的聯絡。

方法一與方法二
我們可以推匯出方法一與方法二中引數的關係,
2 r sin ⁡ s r = 2 r 2 − x 2 2r\sin \frac{s}{r}=2\sqrt{r^2-x^2} 2rsinrs=2r2x2

於是方法一與方法二的積分割槽域實際上是等價的,然而在積分割槽域上這個隱函式並不是微分同胚,下圖展示 r = 1 r=1 r=1的情形,橫軸為 x x x,縱軸為 s s s
紅線: 2 sin ⁡ s = 2 1 − x 2 2\sin s=2\sqrt{1-x^2} 2sins=21x2
紫線: 2 sin ⁡ s = 1 2\sin s=1 2sins=1
綠線: 2 1 − x 2 = 1 2\sqrt{1-x^2}=1 21x2 =1
方法一中,弦長大於半徑的概率對應於第一象限中綠線到縱軸的距離比上第一象限內紅線的橫截距到原點的距離;方法二中,弦長大於半徑的概率對應於兩條紅線的交點到任意一條紫線的距離比上兩條紅線的交點到原點的距離。注意到三條線總是交於同一點的,這說明在方法一與方法二中,儘管用到的引數不同,但是對應的事件是相同的。那麼為什麼會造成兩種情況概率不同呢?很簡單,就是因為在 x ∈ [ 0 , 1 / 2 ] , y ∈ [ 0 , π / 2 ] x \in [0,1/2],y \in [0,\pi/2] x[0,1/2],y[0,π/2]這個視窗中,紅線並不是直線,於是表示幾何概率的兩條線段比例並不相同。

要更詳細地回答這個問題就要回顧一下數學史,幾何概型在蒲豐投針問題之後開始被普遍接受,但當時被人們所熟知的幾何體系依然是古典幾何也就是歐氏幾何體系,微分幾何尚在發展之中,所以幾何概型中所用的幾何其實是古典幾何。然而幾何概型在使用中又確實觸及到了古典幾何的邊界,因為它使用了引數化的方式去描述幾何物件,但又試圖用直角座標系來處理引數,這背後蘊涵的假設是引數座標系與真實的物理座標系之間是一個線性變換,但如這個例子( x ∈ [ 0 , 1 / 2 ] , y ∈ [ 0 , π / 2 ] x \in [0,1/2],y \in [0,\pi/2] x[0,1/2],y[0,π/2]),引數座標系與真實的物理座標之間、引數座標系與引數座標系之間是微分同胚的關係,這就脫離了古典幾何的體系,於是導致了悖論的產生。

不過在Bertrand Paradox之後沒過多少年,在Kolmogorov、Markov等數學家的努力下,概率論在測度論的基礎上被正式地公理化了。公理化的積極意義在於當我們在給定的概率空間中討論問題時,不會出現Bertrand paradox這樣一題多解的困境。然而這也帶來的新的問題,我們在分析問題之前需要做出選擇,應該如何建立合適的概率空間。

所以Bertrand Paradox到現在也不能說它得到了完美的解決,因為它的核心觀點在於建立不同的概率模型可能會導致不同的計算結果,而概率論公理化只告訴我們這些不同的計算結果在同胚的意義下是等價的。要進一步解釋Bertrand Paradox需要大家學習試驗設計與分析、抽樣調查這兩門可,瞭解不同的試驗與取樣方式會如何造成不同的隨機性。

在這裡插入圖片描述

方法一與方法三
我們換一種方法敘述方法一,考慮圓 x 2 + y 2 = r 2 x^2+y^2=r^2 x2+y2=r2,考慮圓周上的兩個點,用 s , t s,t s,t表示這兩個點的位置, s , t s,t s,t表示從 ( 0 , − r ) (0,-r) (0,r)沿逆時針方向到這兩個點的弧長,則 s , t ∈ [ 0 , 2 π r ] , s ≠ t s,t \in [0,2\pi r],s \ne t s,t[0,2πr],s=t,不妨假設 s < t s<t s<t,則用 Ω 1 \Omega_1 Ω1表示方法一的所有基本事件,
Ω 1 = { ( s , t ) : s < t , s , t ∈ [ 0 , 2 π r ] } \Omega_1 = \{(s,t):s<t,s,t \in [0,2\pi r]\} Ω1={(s,t):s<t,s,t[0,2πr]}

連線這兩個點的弦長為
2 r sin ⁡ t − s 2 r 2r \sin \frac{t-s}{2r} 2rsin2rts

A 1 A_1 A1表示弦長大於半徑的事件,則
A 1 = { ( s , t ) : 2 r sin ⁡ t − s 2 r ≥ r } ∩ Ω 1 A_1 = \{(s,t):2r \sin \frac{t-s}{2r} \ge r\} \cap \Omega_1 A1={(s,t):2rsin2rtsr}Ω1

根據Fubini定理,
∬ Ω 1 d s d t = ∫ 0 2 π r ∫ 0 t d s d t = 2 π 2 r 2 \iint_{\Omega_1}dsdt=\int_0^{2\pi r} \int_0^tdsdt = 2\pi^2r^2 Ω1dsdt=02πr0tdsdt=2π2r2

考慮 A 1 A_1 A1
A 1 = { ( s , t ) : π r 6 ≤ t − s ≤ 5 π r 6 } A_1 = \{(s,t):\frac{\pi r}{6} \le t-s \le \frac{5 \pi r}{6}\} A1={(s,t):6πrts65πr}

根據Fubini定理,
∬ A 1 d s d t = 4 3 π 2 r 2 \iint_{A_1}dsdt =\frac{4}{3}\pi^2 r^2 A1dsdt=34π2r2

於是這種構造下,概率也是 1 / 3 1/3 1/3。下面討論座標變換,考慮 s , t s,t s,t的中點,
{ x = r sin ⁡ ( s / r − π / 2 ) + r sin ⁡ ( t / r − π / 2 ) 2 y = r cos ⁡ ( s / r − π / 2 ) + r cos ⁡ ( t / r − π / 2 ) 2 \begin{cases} x = \frac{r\sin(s/r-\pi/2)+r\sin(t/r-\pi/2)}{2} \\ y = \frac{r\cos(s/r-\pi/2)+r\cos(t/r-\pi/2)}{2} \end{cases} {x=2rsin(s/rπ/2)+rsin(t/rπ/2)y=2rcos(s/rπ/2)+rcos(t/rπ/2)

顯然 ( x , y ) (x,y) (x,y) ( s , t ) (s,t) (s,t)是微分同胚,根據積分換元公式
∬ A 1 d s d t = ∫ A 1 ( x , y ) ∣ ∂ ( s , t ) ∂ ( x , y ) ∣ d x d y \iint_{A_1}dsdt=\int_{A_1(x,y)} |\frac{\partial (s,t)}{\partial (x,y)}|dxdy A1dsdt=A1(x,y)(x,y)(s,t)dxdy

可以得到方法一與方法三的聯絡,後續留給讀者自行探索。

關於Bertrand paradox,更嚴謹更詳細的討論可以參考Bertrand’s Paradox Revisited: More Lessons about that Ambiguous Word, Random

相關文章