關於共軛分佈,beta分佈,二項分佈和Dirichlet分佈、多項式分佈的關係
參考:http://www.cnblogs.com/wybang/p/3206719.html
在機器學習領域中,概率模型是一個常用的利器。用它來對問題進行建模,有幾點好處:1)當給定引數分佈的假設空間後,可以通過很嚴格的數學推導,得到模型的似然分佈,這樣模型可以有很好的概率解釋;2)可以利用現有的EM演算法或者Variational method來學習。通常為了方便推導引數的後驗分佈,會假設引數的先驗分佈是似然的某個共軛分佈,這樣後驗分佈和先驗分佈具有相同的形式,這對於建模過程中的數學推導可以大大的簡化,保證最後的形式是tractable。
在概率模型中,Dirichlet這個詞出現的頻率非常的高。初始機器學習的同學或者說得再廣一些,在學習概率模型的時候,很多同學都不清楚為啥一個表現形式如此奇怪的分佈Dirichlet分佈會出現在我們的教科書中,它是靠啥關係攀上了多項分佈(Multinomial distribution)這個親戚的,以至於它可以“堂而皇之”地扼殺我大天朝這麼多數學家和科學家夢想的?為了引出背後這層關係,我們需要先介紹一個概念——共軛先驗(Conjugate Prior)。
- Conjugate Prior: In Bayesian probability theory, if the posterior distributions p(θ|x) are in the same family as the prior probability distribution p(θ), the prior and posterior are then called conjugate distributions, and the prior is called a conjugate prior for the likelihood. ----from wiki
- 用中文來講,在貝葉斯統計理論中,如果某個隨機變數Θ的後驗概率 p(θ|x)和其先驗概率p(θ)屬於同一個分佈簇的,那麼稱p(θ|x)和p(θ)為共軛分佈,同時,也稱p(θ)為似然函式p(x|θ)的共軛先驗。
介紹了這個重要的概念之後,我們回到文章的正題。首先需要弄清楚什麼是二項分佈(Binomial distribution)。這個概念是從伯努利分佈推進的。伯努利分佈是一個離散型的隨機分佈,其中的隨機變數只有兩類取值,非正即負{+,-}。二項分佈即重複n次的伯努利試驗,記為 X~b(n,p)。概率密度函式(概率質量函式)為。再來看看Beta分佈,給定引數和,取值範圍為[0,1]的隨機變數x的概率密度函式,其中,。這裡假定,先驗分佈和似然概率如下所示:
那麼很容易知道後驗概率(條件概率)為
弄清楚了Beta分佈和二項分佈之間的關係後,對於接下來的Dirichlet 分佈和多項分佈(Multinomial distribution)的關係理解將會有非常大的幫助。多項分佈,從字面上所表現出的含義,我們也大抵知道它的意思。它本身確實也是這樣的,其單次試驗中的隨機變數的取值不再是0-1的,而是有多種離散值可能(1,2,3...,k),其中。多項分佈的概率密度函式為。而Dirichlet分佈的的密度函式形式也如出一轍:,其中。到這裡,我們可以看到Beta分佈和Dirichlet 分佈有多相似啊,二項分佈和多項分佈有多相似啊!
再一次來看看共軛。假設有先驗分佈
,
另有似然函式
則後驗概率
,和Dirichlet 分佈形式一致。
其實,細心的讀者已經發現,這裡這四類分佈,如果但從數學形式上看,它們的組織形式都是一致的,都是通過乘積的形式構成,加上先驗分佈、似然函式和後驗分佈之間的乘積推導關係,可以很容易發現,它們所表現出的共軛性質很容易理解。
相關文章
- 概率演算法_二項分佈和泊松分佈演算法
- 泊松分佈和指數分佈:10分鐘教程
- 3分鐘tips:高斯分佈和高斯積分的關係
- 動態分佈與靜態分佈的區別
- PRML 概率分佈概率分佈
- css多列等寬分佈程式碼例項CSS
- 卡方分佈和 Zipf 分佈模擬及 Seaborn 視覺化教程視覺化
- 多元統計分析04:多元正態分佈的抽樣分佈
- 二、hadoop偽分佈搭建Hadoop
- HBASE偽分佈搭建
- 正態分佈函式值函式
- $\Beta$分佈推導與視覺化視覺化
- 多項分佈模擬及 Seaborn 視覺化教程視覺化
- Python獲取好友地區分佈及好友性別分佈Python
- NumPy 二項分佈生成與 Seaborn 視覺化技巧視覺化
- 聯邦學習:按Dirichlet分佈劃分Non-IID樣本聯邦學習
- 業務分佈地圖怎麼做,用地圖製作客戶分佈圖地圖
- 正態分佈的應用——基於描述性統計與分佈的推論
- .NET開發者省份分佈排名
- 熟悉常見概率分佈概率分佈
- Redis 實現分佈鎖Redis
- Greenplumhash分佈演算法演算法
- 正態分佈簡述
- css數字分頁佈局程式碼例項CSS
- 十分鐘學習泊松分佈
- 位置分佈圖怎麼畫,怎麼做地圖網點分佈圖地圖
- HADOOP的偽分佈搭建Hadoop
- 常見的機率分佈
- 隨機變數函式的分佈隨機變數函式
- 二維或三維的分佈積分方法(格林公式)7公式
- 區域分佈圖怎麼做,怎麼做區域網格分佈圖
- 玻爾茲曼能量分佈律及麥克斯韋速度分佈推導
- [Python輿情分析] 二.時間間隔分佈研究及冪律分佈圖繪製Python
- 如何通俗理解泊松分佈?
- 程式虛擬空間分佈
- 【scipy 基礎】--統計分佈
- Hadoop偽分佈模式(HDFS)Hadoop模式
- flex產品列表均勻分佈程式碼例項Flex