先驗概率與後驗概率、貝葉斯區別與聯絡

夜空中最亮的不咚發表於2018-03-30

原文網址 : https://juejin.im/post/5abe1ba6f265da238532faa7

先驗概率和後驗概率

教科書上的解釋總是太繞了。其實舉個例子大家就明白這兩個東西了。

假設我們出門堵車的可能因素有兩個（就是假設而已，別當真）：車輛太多和交通事故。

堵車的概率就是先驗概率 。

那麼如果我們出門之前我們聽到新聞說今天路上出了個交通事故，那麼我們想算一下堵車的概率，這個就叫做條件概率 。也就是P(堵車|交通事故)。這是有因求果。

如果我們已經出了門，然後遇到了堵車，那麼我們想算一下堵車時由交通事故引起的概率有多大，

那這個就叫做後驗概率 （也是條件概率，但是通常習慣這麼說）。也就是P(交通事故|堵車)。這是有果求因。

下面的定義摘自百度百科：

先驗概率是指根據以往經驗和分析得到的概率,如全概率公式,它往往作為"由因求果"問題中的"因"出現.

後驗概率是指依據得到"結果"資訊所計算出的最有可能是那種事件發生,如貝葉斯公式中的,是"執果尋因"問題中的"因".

那麼這兩個概念有什麼用呢？

最大似然估計

我們來看一個例子。

有一天，有個病人到醫院看病。他告訴醫生說自己頭痛，然後醫生根據自己的經驗判斷出他是感冒了，然後給他開了些藥回去吃。

有人肯定要問了，這個例子看起來跟我們要講的最大似然估計有啥關係啊。

關係可大了，事實上醫生在不知不覺中就用到了最大似然估計（雖然有點牽強，但大家就勉為其難地接受吧^_^）。

怎麼說呢？

大家知道，頭痛的原因有很多種啊，比如感冒，中風，腦溢血...（腦殘>_<這個我可不知道會不會頭痛，還有那些看到難題就頭痛的病人也不在討論範圍啊！）。

那麼醫生憑什麼說那個病人就是感冒呢？哦，醫生說這是我從醫多年的經驗啊。

我們們從概率的角度來研究一下這個問題。

其實醫生的大腦是這麼工作的，

他計算了一下

P(感冒|頭痛)（頭痛由感冒引起的概率，下面類似）

P(中風|頭痛)

P(腦溢血|頭痛)

...

然後這個計算機大腦發現，P(感冒|頭痛)是最大的，因此就認為呢，病人是感冒了。看到了嗎？這個就叫最大似然估計（Maximum likelihood estimation，MLE） 。

我們們再思考一下，P(感冒|頭痛)，P(中風|頭痛)，P(腦溢血|頭痛)是先驗概率還是後驗概率呢？

沒錯，就是後驗概率。看到了吧，後驗概率可以用來看病（只要你算得出來，呵呵）。

事實上，後驗概率起了這樣一個用途，根據一些發生的事實（通常是壞的結果），分析結果產生的最可能的原因，然後才能有針對性地去解決問題。

那麼先驗概率有啥用呢？

我們來思考一下，P(腦殘|頭痛)是怎麼算的。

P(腦殘|頭痛)=頭痛的人中腦殘的人數/頭痛的人數

頭痛的樣本倒好找，但是頭痛的人中腦殘的人數就不好調查了吧。如果你去問一個頭痛的人你是不是腦殘了，我估計那人會把你拍飛吧。

接下來先驗概率就派上用場了。

根據貝葉斯公式 ，

P(B|A)=P(A|B)P(B)/P(A)

我們可以知道

P(腦殘|頭痛)=P(頭痛|腦殘)P(腦殘)/P(頭痛)

注意，(頭痛|腦殘)是先驗概率，那麼利用貝葉斯公式我們就可以利用先驗概率把後驗概率算出來了。

P(頭痛|腦殘)=腦殘的人中頭痛的人數/腦殘的人數

這樣只需要我們去問腦殘的人你頭痛嗎，明顯很安全了。

（你說腦殘的人數怎麼來的啊，那我們就假設我們手上有一份傳說中的腦殘名單吧。那份同學不要吵，我沒說你在名單上啊。

再說調查腦殘人數的話我們就沒必要抓著一個頭痛的人問了。起碼問一個心情好的人是否腦殘比問一個頭痛的人安全得多）

我承認上面的例子很牽強，不過主要是為了表達一個意思。後驗概率在實際中一般是很難直接計算出來的，相反先驗概率就容易多了。因此一般會利用先驗概率來計算後驗概率。

似然函式與最大似然估計

下面給出似然函式跟最大似然估計的定義。

我們假設f是一個概率密度函式，那麼

是一個條件概率密度函式（θ 是固定的）

而反過來，

叫做似然函式 （x是固定的）。

一般把似然函式寫成

θ是因變數。

而最大似然估計 就是求在θ的定義域中，當似然函式取得最大值時θ的大小。

意思就是呢，當後驗概率最大時θ的大小。也就是說要求最有可能的原因。

由於對數函式不會改變大小關係，有時候會將似然函式求一下對數，方便計算。

例子：

我們假設有三種硬幣，他們扔到正面的概率分別是1/3，1/2，2/3。我們手上有一個硬幣，但是我們並不知道這是哪一種。因此我們做了一下實驗，我們扔了80次，有49次正面，31次背面。那麼這個硬幣最可能是哪種呢？我們動手來算一下。這裡θ的定義域是{1/3，1/2，2/3}

$/begin{align}/Pr(/mathrm{H} = 49 /mid p=1/3) & = /binom{80}{49}(1/3)^{49}(1-1/3)^{31} /approx 0.000 //[6pt]/Pr(/mathrm{H} = 49 /mid p=1/2) & = /binom{80}{49}(1/2)^{49}(1-1/2)^{31} /approx 0.012 //[6pt]/Pr(/mathrm{H} = 49 /mid p=2/3) & = /binom{80}{49}(2/3)^{49}(1-2/3)^{31} /approx 0.054./end{align}$

當p=2/3時，似然函式的值最大，因此呢，這個硬幣很可能是2/3。

先驗概率後驗概率似然估計
2018-03-30
條件概率、全概率、貝葉斯公式理解
2020-05-22
公式
全概率公式、貝葉斯公式
2022-02-02
公式
[筆記]極大似然估計、最大後驗概率、貝葉斯估計
2020-11-07
筆記
貝葉斯推斷 && 概率程式設計初探
2018-08-20
程式設計
最大似然函式和最大後驗概率區別
2020-04-06
函式
詳解最大似然估計（MLE）、最大後驗概率估計（MAP），以及貝葉斯公式的理解
2019-03-30
公式
ML-樸素貝葉斯-先驗分佈/後驗分佈/似然估計
2019-02-21
貝葉斯居然用事件概率，就輕鬆預知了未來？
2018-08-12
事件
條件概率與全概率公式
2019-03-21
公式
01EM演算法-大綱-最大似然估計(MLE)、貝葉斯演算法估計、最大後驗概率估計(MAP)
2018-12-22
演算法
cookie與session的區別與聯絡
2019-02-16
CookieSession
Session與Cookie的區別與聯絡
2018-09-15
SessionCookie
JRE與JDK的區別與聯絡
2023-10-30
JDK
Kafka與ActiveMQ的區別與聯絡詳解
2020-08-13
KafkaMQ
感知器、logistic與svm 區別與聯絡
2018-03-28
詳解Kafka與ActiveMQ的區別與聯絡！
2021-04-25
KafkaMQ
B/S與C/S的聯絡與區別
2020-12-30
概率論假設檢驗試題
2021-01-01
概率分類之樸素貝葉斯分類（垃圾郵件分類python實現）
2020-10-05
Python
樸素貝葉斯與Laplace平滑
2023-03-07
jQuery與JavaScript與ajax三者的區別與聯絡
2020-11-08
jQueryJavaScript
ipv4與ipv6的聯絡與區別
2024-08-08
模式識別與機器學習——概率分佈
2018-11-17
模式機器學習概率分佈
全機率公式與貝葉斯公式
2024-11-27
公式
概率與期望習題總結
2020-10-02
HDFS 塊和 Input Splits 的區別與聯絡
2018-08-14
程式和執行緒的區別與聯絡
2019-09-18
執行緒
javaSE中的==和equals的聯絡與區別
2020-07-01
Java
陣列地址與指標之間的區別與聯絡
2019-01-10
陣列指標
簡述Spring容器與SpringMVC的容器的聯絡與區別
2019-04-25
SpringMVC
貝葉斯A/B測試 - 一種計算兩種概率分佈差異性的方法過程
2019-02-27
概率分佈
KPI vs OKR：區別與聯絡的終極指南
2024-05-21
KPIOKR
Vue中watch、computed與methods的聯絡和區別
2019-11-11
Vue
單機、分散式、叢集的區別與聯絡
2020-09-03
分散式
概率論與數理統計 17
2020-11-19
概率論與數理統計 19
2020-11-19
概率論與數理統計（1）
2020-12-21

先驗概率與後驗概率、貝葉斯區別與聯絡

先驗概率和後驗概率

最大似然估計

似然函式與最大似然估計

相關文章