science-wallpaper-hd-7

導語

1987年,是印度傳奇數學家拉曼努揚(SrinivasaRamanujan,1887-1920)的百年誕辰。為了紀念他,有一系列的活動。當代著名統計學者, 出生於印度的勞氏(C. Radhakrishna Rao,1920),也應邀做了三場演講。之後,印度統計學研究所(IndianStatistical Institute)基於勞氏的演講稿,於1989年,為他出版了統計與真理一書。此書於1997年發行第二版。

在第一版的序文中,勞氏提到:

學生時代,我主修數學一種從給定前提下演繹結果的邏輯。後來我念統計學一種從經驗中學習的理性方法,及從給定的結果驗證前提的邏輯。我已認識到數學及統計,在人類為提昇自然知識,及有效管理日常事務所做的一切努力中,佔有重要性。

我相信:

在最終的分析中,所有知識皆為歷史。

在抽象的意義下,所有科學皆為數學。

在理性的世界裡,所有判斷皆為統計。

這一段話,大致說明數學及統計的重要性,及其各自的內涵。

翻開統計史,信賴區間,是另一著名統計學者,出生于波蘭,1938年才移民至美國的奈曼(JerzyNeyman,1894-1981),於1934年演講中首度提出。他的演講結束後,大會主席包雷(Arthur Lyon Bowley, 1869-1957)於致詞中提到,“我不很確定此信心不是一信心戲法”。要知奈曼信賴區間的概念剛提出時,大部分的統計學者,包括被視為是現代統計學之創始者,英國的費雪(Sir Ronald Aylmer Fisher, 1890-1962,常以R.A.Fisher稱之)均難以接受。在所謂95%信賴區間中,那95%究竟是指什麼?是概率嗎?如果是,那又是什麼的概率?雖奈曼取巧地以信賴區間,來稱呼此一他創造出來的東西,而避用概率一詞。但包雷及其同行,當然一眼便看穿這個手法。這段過程,可參考Salsburg(2001)Chapter12(但該書中的A.L.Bowley應該是G.M.Bowley),及Sawilowsky(2003)一文。

歲月匆匆,七十多年過去了,今日統計學家,當然已完全弄懂信賴區問的意義。對不同的引數,不同的分佈,可有不同的信賴區間;即使同一引數且同一分佈,也可以不同的方法,得到不同的信賴區間。有時因條件不足,或計算複雜等原因,只好退而求其次,得到近似的信賴區間。當然這時需要一些條件,及利用一些定理。信賴區間亦可比較優劣。要知統計裡有各種推論方法,但因處理的是隨機現象,少有“倚天既出,誰與爭鋒”的方法。而評比時,也要訂出評比準則。否則就像有個停止不動的鐘,及一每日慢1分鐘的鐘,如何判定何者較準?前者可是每日皆有完全準確的時刻,後者卻是每1440天(一天有1440分),才有一完全準確的時刻。不講清楚如何評比,將會各說各話。

追根究底,還是不少學習者,未能正確瞭解概率的涵意。

概率的意義

一骰子有6個面,一擲之下,會得到偶數之概率為何?骰子看起來沒有異樣,就假設每個面出現的概率皆相同,即均為1/6。而偶數面有2,4,及6等3個。因此所求之概率為3/6。這就是所謂古典的概率,基本假設是“相同的可能性”。先求出觀測的現象共有幾種可能,再求出其中有幾件是我們有興趣的。將後者除以前者,即為所要的概率。雖說是“古典”,這種概率的意義,至今仍處處可見。採用的範圍包含諸如抽籤、玩撲克牌,及玩樂透彩等。又如某項工作徵才,報名的有82人,錄取5人。若沒有什麼特別的資訊,便只能假設每人被錄取的概率皆相同,即皆為5/82。

2009年7月底8月初,世界高爾夫球王老虎伍茲(TigerWoods),參加在美國密西根州舉行的別克公開賽(Buick Open)。第1輪打完,落後領先者多達8杆,排名並列95。引發他可能難逃職業生涯,首次連續2場比賽(前一場是英國公開賽(The Open Championship,在英國之外常稱為BritishOpen)),提前被淘汰的話題。不過老虎畢竟不能小覷,打完前3輪後,伍茲躍居首位。

這時大家看法丕變,一致認為這座冠軍盃,幾乎可說是他的囊中物了。因過去的紀錄顯示,伍茲如能帶著54洞領先進入決賽圈,戰績是35勝1敗。你要不要猜後來他贏了沒有?運動比賽,往往有過去資料可參考,此時相同的可能性便不宜用了。36次中成功35次,“相對頻率”為35/36(約0.972)。這種以相對頻率來解釋概率,是常有的作法。適用能重複觀測的現象。會不會有爆出冷門的時候?當然有。只是對一特定事件,用過去多次同樣情況下,該事件發生的相對頻率,來估計下一次事件發生的概率,乃是在沒有更多資訊下,常被認為一屬於客觀的辦法。

某君看上一女孩,驚為天人,覺得這是他今生的新娘。評估後信心滿滿,自認追上的機會有8成。旁人卻都不看好,問他8成這一數字,是如何冒出來的?該君舉證歷歷,一個又一個的跡象,顯示那女孩對他很有好感。這個0.8的概率,就是所謂主觀概率。主觀概率當然也可基於過認識概率35去一些客觀的事實。只是即使面對同樣的資料,不同的人,可能有不同的判定,因而給出不同的主觀概率(看過他其實沒那麼喜歡你(He’s Just Not That Into You)嗎?片中那個叫Gigi的女孩,便常誤解男生所透露的訊息)。有些現象就是不能重複觀測。如核能電廠的意外,及彗星撞地球等。以追女孩為例,大約少有女孩,會讓你做實驗,反覆地追,然後數一數其中成功幾次,來定下她會被你追上的概率。對這類無法重複觀測的現象,在談概率時,主觀概率就常派上用場。每天早上出門,我們不是慣於抬頭看天,判斷一下今天下雨的概率有幾成?只是往往父母認為的概率會大些,該帶傘,而小孩所認為的下雨概率會小些。

雖說“主觀”,但仍要合理。例如,考試有及格與不及格。若認為會及格的概率為0.9,這沒問題,人總要有點自信,但若又同時擔心有0.8的概率會不及格,那就不行了。各種可能性發生概率相加要為1。即使是主觀,可以獨排眾議,仍須自圓其說。不能說,既然是主觀,便可以任意自定各事件之概率。因此不論是那一種對概率的解釋,都自然地,或說必須要滿足一些共同的規則。這點大家應能理解。

上述三種是常見對概率的解釋,大抵也就是人們評估事件發生可能性之大小的幾種思維。雖是針對不同的情況,但常能互動著運用。大家都聽過曾參殺人的典故吧!有個與曾子同名的人殺人,好心者告訴曾母“曾參殺人”。曾母說“吾子不殺人”,繼續織布。過一會兒,又有人來說“曾參殺人”。曾母仍繼續織她的布,這麼好的兒子怎可能殺人?但當第三人跑來說“曾參殺人”,曾母就害怕了,丟掉織布器具翻牆而逃。所謂“其母懼,投杼踰牆而走”。這故事出自戰國策秦策二。因此當拿到一銅板,可主觀地認為,政府發行不該會有偏差,兩面出現的概率,應皆為1/2(這也可以是基於相同可能性之想法)。若投擲10次,正面出現8次,可能覺得有些奇怪。若繼續投擲,結果100次中,出現80個正面,這時相對頻率的觀點,很可能便將顯現。類如曾母,調整看法,不再認為此銅板公正。

當然,你可以不信邪,不論投擲的結果如何,皆認為那只是短暫的情況,意志堅定地認為這是一公正的銅板。這並沒有不行,就像會有母親,即使再多的人證,只要她沒親眼看到,她就不信兒子會殺人。要知隨機現象,事件只要概率為正,不論概率值多小,便皆可能發生。畢竟銅板正面出現的概率為何,只有天曉得。但引進概率與統計,乃為了協助我們做決策可以更精準。而決策可以與時推移,並非不能更改。有如氣象局對颱風會帶來多少雨量,須密切掌握新的動向,而隨時修正。要有隨機的思維,如前言中勞氏所說的,從給定的結果,驗證前提。因此針對100次投擲,出現80個正面,多數人面對此結果,還是會認為0.8的正面出現概率,較0.5的概率可信。稍後我們會再來看,10次中的8次,與100次中的80次,相對頻率同為0.8,但提供的資訊,是否有異?

雖然已有上述三種對概率的解釋,也涵蓋了不少實際生活中所遇到的情況,數學家當然不會在此止步。他們喜歡抽象化,及一般化。像解方程式,會尋求公式,以表示出某類方程式的解,而非只滿足於求出一個個的特例之解。又如當完全瞭解實數系統後,便會以公理化的方式,定義實數系統。即給一集合,沒說是數字的集合,對其中的元素定義二運算,並給出10條遵循的公理(axiom,規則)。你好奇該二運算是否一為加法,一為乘法?而怎麼沒有減法與除法?名可名,非常名,數學家不認為你提出的是重要的問題。但用心體會後,你終於發現原來二運算,其一等同於加法,其二等同於乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。數學家對你的洞察力,仍不以為意,但同意你可以這樣想。

什麼叫以公理化的方式,來引進概率?先要有一個集合,稱做樣本空間,當做某一觀測之所有可能結果的集合。可以真的有這一觀測,或只是虛擬的。樣本空間的某些子集合,是我們有興趣的,這些就是一個個的事件。所有事件也構成一集合。最後定出一概率函式,即對每一事件,給一介於0,1間的值,為該事件之概率。樣本空間、事件的集合,及概率函式,三者便構成概率空間(probability space)。這其中對樣本空間沒有太大要求,但不可以是空集合。而事件的集合,要滿足若干條件。簡單講,就是你有興趣的事件不能太少。譬如說,不能只對某事件A發生有興趣,卻對A不發生沒興趣。因此事件的集合要夠大,至少該有的都得納入。這有點像婚宴前擬賓客名單。可以請很少人,如只有雙方家長。而一旦多列了某人,與他同樣親近的人便也要一併請。所以每多列1人,將不只是增加1人而已,而會隨之增加幾位。又概率函式,既然以概率之名,當然要符合過去大家對概率的認知,滿足一些基本的條件。

在概率空間的架構下,不論採用何種方式解釋概率的人,都可各自表述,找到他所以為的概率意義。但因抽象化後,不再侷限於銅板、骰子,及撲克牌等,便能討論較一般的問題,有夠多的理論可挖掘。

與數學的其他領域相比,概率論的發展是較晚的。但公理化後,概率論便快速地有了深而遠的發展,併成為數學中一重要的領域。這都要歸功於二十世紀那位重要的概率學家,俄國的科莫果洛夫(Andrey Nikolaevich Kolmogorov,1903-1987),於他1933年出版,那本不到100頁的小書概率論的基礎(Foundationsof the Theory of Probability)中所奠定。在此書中,他說:

概率論作為數學學科,可以而且應該從公理開始發展,就如同幾何、代數一樣(Thetheory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra)。

何處是概率天地

有法國牛頓之稱的拉普拉斯(Pierre-Simon,Marquis de Laplace, 1749-1827)曾說:

這門源自考慮賭博中的機運之科學,必將成為人類知識中最重要的一部分,生活中最重要的問題中的大部分,都將只是概率的問題(This science, which originated in the consideration of games ofchance, should have become the most important object of human knowledge. Themost important questions of life are, for the most part, really only problemsof probability)。

概率是針對隨機現象。但世上並非每件事都是隨機的,我們說過還有必然性。假設投擲一兩面皆是人頭的銅板,並觀察會得到那一面。你曉得這是一必然現象,但仍可說會出現人頭的概率為1,而其他情況出現的概率為0。也就是視此為一“退化的”隨機現象。

某些物理學家,說不定認為對投擲銅板,由給定投擲的速度、角度、地面的彈性、銅板的形狀及重量等條件,可算出銅板落地後,會那一面朝上,因此這不是隨機。至於樂透彩的開獎,只要起始條件都能測出,則會開出那一號球,也能算出,因此這也不是隨機。但你大約也知道所謂蝴蝶效應(butterfly effect)。量測極可能有誤差,而有時一些微小的改變,影響卻可能很大。因此我們寧可相信這些都是隨機現象。

某些神學家,可能認為一切其實都是按照神的旨意在進行,只是我們不知而已。說不定真是如此。你看過傑遜王子戰群妖(Jason and the Argonauts)嗎?這是一部基於希臘神話的電影,內容與十二星座中的牡羊座有關,1963出品。我雖是幼時看的,至今仍印象深刻。片中傑遜王子遭遇的各種突如其來的災難,以及一次又一次英勇的逢凶化吉,不過是天后赫拉(Hera),與天神宙斯(Zeus)在較勁,分別作梗及協助。但若無從瞭解神的旨意,對於未來,也只好視為隨機。

隨著科技進步,人們逐漸弄明白很多現象的來龍去脈。例如,我們知道女性一旦懷孕,嬰兒性別便已確定。但對一大腹便便的婦女,好事者由於不知,仍可猜測其生男生女之概率。考試前夕,學生們雖認真準備,但還是絞盡腦汁猜題,各有其認為考出概率很大的題目。老師獲知後,覺得好笑。課堂中已一再暗示明示,那些題會考,幾乎都該能確定了,何需再猜?實則試題早已印妥,而學生不知考題,且未體會老師的暗示及明示,所以仍可以大猜一通。另外,諸如門外有人敲門,你好奇是男是女?老師要你猜拿在背後的水果,是橘子或蘋果?同學蓋住落地的銅板,要你猜正面或反面朝上?這類明明已確定的事,本身其實並不隨機,只是對你而言,卻有如惠子在秋水篇所說的“子非魚”,當然可猜魚快樂的概率。

但對已命好題目的老師,去判斷那一題會考出的概率,就沒什麼意義了。因對他而言,每一題會考出的概率,只有1或0,不會是其他值。同樣地,對看到背後水果的人,水果會是橘子或蘋果的概率,將只能說1或0。隨機與隨意不同。我們說過了,概率中那套邏輯,是有夠大的彈性,讓人能揮灑,只是仍要合理,否則就是抬槓了。若你明明知道那是蘋果,硬要說它是橘子的概率為0.5;或明明已從醫生處掌握一切訊息的待產媽媽,還說生下來,是男是女的概率皆為0.5,那就不是在談概率了。

解釋概率

在第2節我們以概率空間的方式引進概率。由於樣本空間可以是虛擬的,此時事件也就是虛擬的。但假設真的有一項觀測,如投擲一個4面體,4面分別標示點數1,2,3,4,並觀測所得點數。則樣本空間為1,2,3,4之集合。事件的集合可以取那一個最大的,也就是包含樣本空間之所有子集所構成的集合。你如果學過排列組合,便知此最大的事件集合中,共有16(2的4次方)個元素。至於概率函式,假設點數1,2,3,4出現的概率,分別為0.1、0.2、0.3,及0.4,相加為1。至於任一事件的概率,就看該事件包含1,2,3,4中那幾個數,再把對應的概率相加便是。如一事件中恰包含2,4,則該事件的概率為0.2+0.4=0.6。餘此類推。這就建立了一概率空間。對同一樣本空間,可定義出很多不同的概率空間。

就算你已接受了概率空間的概念,反正數學家就是常給一些自得其樂的定義,仍可能會好奇,所謂點數1出現的概率0.1,究竟是什麼意思?是每投10次,點數1恰出現1次嗎?非也!

有個修過概率論的數學系畢業生,好心地對你解釋如下:

假設投擲n次,點數1出現a次,則相對頻率a/n與0.1之差的絕對值,會大於一給定的正數(不管它多小)之概率,將隨著n的趨近至無限大,而趨近至0。

務實的你,很可能不覺得這樣的解釋很實際。先提出疑問“什麼是趨近至無限大?”就是一直投擲,不可停止,日出日落,春去秋來,繼續投擲,即使夸父追日成功了,無限大也仍未達到,還得投擲。那位數學系畢業生,一聽到你問起無限大,如魚得水,這是他在數學系四年寒窗,學到的幾招獨門絕活之一。你不得不停止無限大這個話題,因連夸父追日,你也覺得豈有成功時?如何能接受解釋概率,還得涉及無限大?但還一點你不吐不快的是“我就是不瞭解概率值的意義,怎麼卻用概率的概念來解釋給我聽?”

想解釋概率值的意義,將會在概率及無限大,一層又一層的打轉。這有如想去定義什麼叫做點,結果將如同陷線上團中,學步維艱。最後只好說,點是無定義名詞。但無論如何,你應可理解,對前述4面體,僅投擲1次,是無法顯示點數1出現概率0.1,那個0.1的意思。概率並非只看“少數幾次”的結果。概率是在大樣本(n很大)下,威力才顯現。概率值的意義,既然不能以一套可接受的邏輯來說明。那麼退而求其次,可否讓人略微瞭解概率值的意思?或者說(除非是虛擬,只是在求一些概率值),你拿一4面體,且宣稱點數1出現的概率為0.1,怎麼樣才知道你講的是真的,而非信口開河,或者說記錯。

之前那位數學系畢業生的解釋,這時便能派上用場。此即大數法則(law of large numbers)之一簡單的版本。數學上的意思為,事件出現的相對頻率,會“概率收斂”至事件發生的概率。要知隨機世界中,仍有些法則要遵循,大數法則是其中很重要的一個。當然我們已指出了,實際上並無法觀測事件無限多次。那是否可說,事件出現的相對頻率,當觀測數夠大,須接近事件發生的概率?也非如此。事件只要概率為正,便都可能發生。所以,不論觀測數再大,都不能排除很偏頗(如觀測1,000,000次,點數1出現的次數為0,或1,000,000次)的事件發生。但是,這時統計學家跳出來了,可以做一檢定,檢定點數1出現的概率是否真為0.1,這是屬於統計學裡假設檢定(testing hypothesis)的範疇。簡單講,是以在某一假設下,會觀測到這樣的結果,是否算不尋常?所謂不尋常,是指發生的概率很小,小於某一預設的值。若屬於不尋常,則當初的假設就不宜接受。附帶一提,當假設一銅板為公正,則投擲100次,出現至少80次正面,較投擲10次,出現至少8次正面,前者是更不尋常的,因它發生的概率,遠比後者小。所以,在同樣獲得八成以上的正面數下,投擲數愈大,將會使我們更相信此銅板非公正,而接受它出現正面的概率,至少是0.8。這說明:

在統計裡,樣本數愈大,將使我們的推論愈精準。

在隨機世界,究竟何者為真,常屬未知。我們往往無法“證明”那件事是真實的。不過是一個個的假設,端看你接受那一假設。四面體點數1出現的概率,是否真為0.1,即使投擲再多次,都無法證明其真偽。只能說資料顯示“可以接受”,或“無法接受”概率為0.1。這裡面有一套機制,以決定接受或不接受。

另外,對一四面體,也可估計點數1出現的概率,有一些不同的估計法,可以得到不同的估計量。在數學中,使用不同的方法,須導致相同的結果。所謂殊途同歸。但統計裡,除非做些限制,否則常無定於一尊的方法。對不可測的未來,我們常要做估計,統計在這方面,能扮演很好的角色。諸如銅板出現正面的概率,及病人的存活率等,皆能估計。但有時覺得以一個值估計,雖然明確,但估計值很難恰好等於真實值,一翻兩瞪眼,常估計不準。信賴區間的概念,因而產生。

信賴區間

我們常對某一未知的量做估計。未知的量可以是某事件發生的概率,某分佈的引數(如期望值及變異數等),或某物件之壽命等。這些未知的量,可通稱為引數。有時會以一區間來估計引數,並給出此區間會涵蓋該引數之概率。這就是所謂區間估計,所得的區間,稱為信賴區間。而區間涵蓋引數之概率,則稱為此區間之信心水準(confidence level)。與概率一樣,信心水準是一介於0,1間的值,常事先給定,且以百分比表示。90%、95%、99%等,都是常取的值。

資料(data)是統計學家做決策之主要依據。若缺乏資料,他們往往將一籌莫展。來看一簡單且常見的情況。假設欲估計一銅板出現正面之概率p。很自然地,便投擲若干次,譬如說n次,並觀測n次的結果。這個過程便稱為取樣。在本情況中,各次投擲的結果並不重要。總共得的正面數,以a表之。知道a,就已掌握全部資訊[a稱為充分統計量(sufficient statistic)]。給定信心水準,並利用n及a,可得一信賴區間,但作法並不唯一。亦即對於p,有不同的信賴區間公式。但課綱的寫法,好像信賴區間的公式唯一。此處由於其中涉及二項分佈,計算複雜些,如果n夠大(n太小則不行),我們常可藉助常態分佈來近似。這要用到概率論裡另一重要的法則—中央極限定理(Central limit theorem)。必須一提,只有以常態分佈來近似時,才需用到中央極限定理,並非求信賴區間皆要用到此定理。

對估計銅板出現正面之概率p,取樣前,信賴區間為一隨機區間,若信心水準設定為95%,則有(或精準地說“約有”,如果該信賴區間只是近似的)0.95的概率,信賴區間會包含p。取樣後,得到一固定區間。則p會屬於該區間的概率,將不是1便是0,而不再是p了。為何如此?很多人對此常感困惑。

我們先以下例來說明。假設某百貨公司週年慶,顧客購物達一定金額,便能自1至10號中抽1綵球。若抽中5號,今天在該公司的花費,可獲30%抵用券。在抽球之前,你知道有0.1的概率能獲抵用券,機會不算小。一旦抽出,一看是3號,獲抵用券的概率當然便是0了。

這類例子很多。打擊手揮棒前,可以說打出安打之概率為0.341,打完不是安打就非安打,0.341已派不上用場了。再給一例。假設某銀行發行的樂透彩,每期自1至42號中,開出6碼為頭獎號碼。你簽了一注6碼,開獎前,你知道很容易“至少中1碼”,因概率約為0.629(見附註1)。等開獎後,你的彩券會至少中1碼之概率,將是1(若至少中1碼),或是0(若1碼皆未中)。

再看如課綱中所說,也可以亂數表模擬出現正面(課綱中少了“正面”二字,意思便不通)概率為p的銅板n次,以求得信賴區間。你看,p根本是事先設定,模擬所得之一固定區間,p有沒有落在其間,一看便知,如何能說該區間涵蓋p之概率為0.95?就算你不是模擬,而是實際拿一銅板投擲,則p只是未知,卻為某一定值(說不定發行銅板的單位知道),投擲後所得之固定信賴區間,已無隨機性了,它只會涵蓋p,或不會涵蓋p。可以這樣想,對同一銅板,每人所得之95%信賴區間有異,如何能個個皆宣稱,其區間涵蓋p之概率為0.95?

那95%有何用?0.95是一概率值,而概率值從來就不是隻看一次的實驗結果。大約可以這麼說,如果反覆實驗,而得到很多信賴區間,則其中會包含p的信賴區間數,約佔全部區間數的95%。所以,0.95的意義,乃如同上一節我們對概率的解釋。但要留意的是,對同一個p,如果全班40人,所得到的40個95%信賴區間,其中包含p的個數未超過85%(即未超過34個),也不要太驚訝。此概率約為0.01388(附註2),是不太大,但只要班級數夠多,便不難發生。98課綱說“大多數學生所得的信賴區間都會涵蓋p”,實在缺乏隨機的概念。

情境解讀

概率既然與我們的生活習習相關,因此若能善用概率,將有助於在隨機世界中,更精準的做決策。只是卻往往概率應用不易,得到的概率值,常被認為是錯的。而且還眾說紛紜,各提出不同的概率值。箇中原因何在?一主要原因,即情境解讀有誤。

過去大家在數學課程中,會遇到所謂應用題。題目看懂,寫出數學式子後,就是解數學了。這時便可拋開原先那段冗長的敘述。但在概率裡,有些看似簡單的情境,因解讀不同,會導致南轅北轍的結論。底下給幾個例子來看。

在電影決勝21點(英文片名就是21)中,那位數學教授於課堂上提出一個問題。有3扇門,其中1扇門後有汽車,另兩扇門後為山羊。你選擇第1扇門後,主持人開啟第2扇門,見到山羊。問你這時該不該換選第3扇門?有位學生答:

Yes, because my chance of getting the car will increase from 33.33% to 66.67% by switching from door 1 to door 3.

教授則說“Very good!”,認同其看法,也就是該換。有些人對此提出質疑。

比較正確的講法應該是,若主持人事先知道汽車在那扇門後,則他會開啟1扇門後是山羊的門(這是較合理的作法,否則遊戲便無法進行了),這時若換選第3扇門,則如電影中那位學生所述,得到汽車的概率,將由1/3增加為2/3。但若主持人事先不知汽車在那1扇門後(這當然是少見的情況),只是隨機地自第2及第3扇門中,挑一扇開啟,且剛好門後是山羊,則便不用換,因換或不換,得到汽車之概率,皆為1/2。

但是讀者不知是否注意到,在主持人事先知道汽車在那一扇門後的情況中,我們其實還隱含做一假設。即若第2及第3扇門後皆是山羊,則主持人乃隨機地(即各以1/2的概率)開啟第2或第3扇門。事實上,可以有更一般的假設。當第2及第3扇門後皆是山羊,假設主持人分別以q及1/q的概率,開啟第2或第3扇門,其中0≤q≤1。則換選第3扇門,得到汽車的概率成為1/(1+q)(見附註2)。原來此概率會受主持人是如何開啟第2扇門的影響!很多人可能未想到這點。由於1/(1+q)≥1/2,所以換,仍是較好的選擇。

再看一例。有一對夫妻剛搬進某社群,大家只知他們有兩個小孩,並不知性別。某日社群一管理員,見到此家之媽媽,帶著家中一小孩在玩耍。若該小孩是女孩,求此家兩小孩皆為女孩之概率。很多人以為此問題不難,認為所求概率就是1/3。其實此問題比我們想像的複雜很多。關鍵在如何將“見到此家之媽媽,帶著家中一女孩“,轉化為適當概率空間中的事件。也就是要講清楚,究竟如何帶小孩出門?要注意的是,前述事件並不等同於“此家至少有一女孩”!

最後看另一常出現於概率論教科書中的例子。平面上有一單位圓,隨機地畫一條弦,求弦長大於此圓的內接等邊三角形之邊長的概率。利用幾何,單位圓的內接等邊三角形之邊長可求出。但如何是隨機地畫一條弦呢?要知由1至n的n個正整數中,隨機地取1數,其意義較清楚,就是每一數被取中的概率皆為1/n。自區間[0,1]中隨機地取1數,其意義也還明白,就是此數會落在[0,1]之任一子區間的概率,為該子區間之長度。但隨機的畫弦,是如何畫法?此處對於“隨機”一詞,可以有好多種解釋。解釋不同,畫弦的方式將不同,因而求出的概率也就不同。

上面這幾個例子告訴我們,在處理概率問題時,情境要定義清楚。用術語來說,就是概率空間要明確給出,否則將導致各說各話。有時雖未給出概率空間,但情境較簡單,大家有共同看法,這時未特別強調概率空間為何,還沒問題。如“投擲一公正的骰子,求點數大於4之概率”。雖只是簡單的描述,但不至於有疑義。當對情境有疑義時,就要如莊子在秋水篇講的,“請循其本”,把概率空間調出來。此有如政治上或社會上,遇到有重大爭議時,就要祭出憲法,看有沒違憲,並由大法官解釋。對一給定的情境,要很謹慎的面對。否則即使是概率統計專業人士,也可能解讀錯誤。

情境解讀之外,概率中一些獨特的概念,像是條件概率,獨立性,及隨機取樣等,也是應用概率時,得謹慎留意的。