通俗易懂講解貝葉斯論和頻率論兩者之間的區別?

banq發表於2021-06-07

貝葉斯統計推斷和頻率統計推斷之間一直存在爭論。頻率論者在 20 世紀主導了統計實踐。許多常見的機器學習演算法(如線性迴歸和邏輯迴歸)使用頻率論方法來執行統計推斷。雖然貝葉斯在 20 世紀之前主導了統計實踐,但近年來貝葉斯學派中的許多演算法,如期望最大化、貝葉斯神經網路和馬爾可夫鏈蒙特卡羅演算法,在機器學習中越來越受歡迎。
 

簡單案例
引用stackexchange中最受歡迎的比喻:
以下是我向祖母解釋基本區別的方式:
我把手機放錯了家裡的某個地方。我可以使用儀器底座上的電話定位器來定位電話,當我按下電話定位器時,電話開始發出嗶嗶聲。
問題:我應該搜尋我家的哪個區域?

  • 1. 頻率推理

我能聽到電話的嗶嗶聲。我還有一個心智模型(以前手機頻繁地出現什麼區域),這可以幫助我識別聲音來自的區域。因此,聽到嗶嗶聲後,我會推斷出我必須搜尋我家的區域。(把某事件發生的頻率作為該事件發生的機率。)
  • 2. 貝葉斯推理

我能聽到電話的嗶嗶聲。現在,除了幫助我識別聲音來源區域的心智模型之外,我還知道我過去將手機放錯了位置。因此,我將使用蜂鳴聲的推論和我過去將手機放錯位置的先前資訊結合起來,以確定我必須搜尋的區域才能找到手機。(有一個先驗假設,隨著樣本的增加如手機放錯位置,不斷的修正先驗的機率分佈。)
 

對機率的定義不同
無論頻率論者還是貝葉斯論者,都是基於"假設"的判斷,例如,假設無論你您多少次擲硬幣,則正面朝上 50%,基於這些大量觀察的場景(=假設)。

  • 在頻率論推斷中,機率被解釋為長期執行頻率。目標是建立具有長期執行頻率保證的過程。
  • 在貝葉斯推理中,機率被解釋為主觀信念度。目標是陳述和分析你的信念。

問題複雜在於兩種主義對機率的定義是不同的,如果我說“這枚硬幣正面朝上的機率為 1/2”,這是什麼意思?
  • 頻率論者的解釋是,如果我們進行了多次拋硬幣,那麼正面的計數(“頻率”)除以拋硬幣的總數應該或多或少地越來越接近 1/2。這沒有任何主觀性可以被視為一件好事,但是我們無法真正執行無限次拋硬幣,甚至在某些情況下我們根本無法重複實驗。
  • 貝葉斯觀點是主觀的,將機率視為某種“信念程度”或“賭博機率”。例如,兩個人可能對他們對硬幣的看法(先驗機率)有不同的信念,從而進入拋硬幣實驗。在收集了資料/證據的實驗之後,人們根據貝葉斯定理更新了他們的信念,他們對硬幣的後驗機率是什麼釋出了不同的想法,並且兩個人都可以證明他們的信念是“合乎邏輯的”/ “理性”/“連貫”(取決於貝葉斯解釋的確切風格)。

 

哪個更客觀?
兩者都不!它們都基於假設,因此它們基本上是主觀的,見這篇基於假設的文章,兩者都與樣本量無關,頻率適合大量資料?,少量資料適合貝葉斯?不!更少的資料意味著需要預設更多的假設前提,假設太多,結論越含有水分。
兩者關鍵的區別在於,它倆都取決於上下文:上下文是需要在行動之間做出選擇?還是需要形成基於證據的意見?
 

相關文章