統計學習方法筆記-EM演算法

三歲就很萌@D發表於2020-11-19

原文網址 : https://blog.csdn.net/qq_44822951/article/details/109697267

筆記演算法

一 EM演算法引入

EM演算法是一種用於含有隱變數的概率模型引數的極大似然估計。它分為兩步進行: 第一步E步，求期望。第二步M步，求極大。所以也被稱為期望極大演算法。

看了上面的描述可能會有疑問，什麼叫做含有隱變數的概率模型引數的極大似然估計。

我們首先說一下什麼叫做似然函式和極大似然估計：

在數理統計學中，似然函式是一種關於統計模型中的引數的函式，表示模型中引數的似然性，似然性類似於概率，指某種事件發生的可能性。

在通常情況下我們是根據已知條件來推測結果的,但極大似然估計是已知結果，我們選取讓這種結果出現概率最大的條件。

舉個例子，現在有一張滿分試卷，並且跟你說了這張試卷可能是小花或者是小明的（小花是眾所周知的學霸，小明是眾所周知的學渣) 。問你這張試卷是誰的？潛意識中你會覺得這是小花的。這其中其實就蘊含了極大似然估計的道理。

在上述例子中，我們可以認為，結果是一張滿分試卷，引數是寫卷子的人{小花，小明}。我們已知了結果，選取引數是小花，可以讓我們的結果(滿分試卷)出現的概率最大。

在上述例子中我們除了引數是未知的其餘都是已知的，所以可以直接極大化似然函式來求解引數，但是如果我們的模型中，除了未知引數外，還有一些隱變數，我們又該如何去求解未知的引數呢？

我們看一下著名的三硬幣模型(它就是一個既含有未知引數又含有隱變數的概率模型)

假設有 3 枚硬幣，分別記作 A， B， C。這些硬幣正面出現的概率分別是π， p 和 q。進行如下擲硬幣試驗: 先擲硬幣 A，根據其結果選出硬幣 B 或硬幣 C，正面選硬幣 B，反面選硬幣 C; 然後擲選出的硬幣，擲硬幣的結果，出現正面記作1，出現反面記作 0; 獨立地重複 n 次試驗(這裡， n= 10) ，觀測結果如下: 1,1,0,1,0,0,1,0,1,1

假設只能觀測到擲硬幣的結果，不能觀測擲硬幣的過程。問如何估計三硬幣正面出現的概率,即三硬幣模型的引數。

根據這個例子我們先明確幾個概念

觀測變數: 模型中可以直接觀測，即在研究中能夠收集到的變數成為觀測變數。

隱變數: 模型中不可觀測的隨機變數，我們通常通過可觀測變數的樣本對隱變數作出推斷。

在三硬幣模型中，我們通過拋擲硬幣A確定了拋硬幣B或者C,之後通過一次拋擲我們得到了一個結果1或者0 ，這一次的結果就是可觀測的，我們稱其為觀測變數，記作隨機變數y。而拋擲硬幣A的結果是不可觀測的，它就是一個隱變數，記作隨機變數z。而引數就是硬幣A,B,C 正面出現的概率π，p，q

明白了這些以後，回到我們的問題，在有隱變數z的情況下，我們如何估計模型的引數？

我們先來看一個簡單的情況，有一個硬幣，拋正面的概率是p 則拋反面的概率是 1-p ，在將這個硬幣拋擲10次後，我們得到一個觀測序列1,1,0,1,0,0,1,0,1,1 ，如何估計它的引數p

這個問題很顯然就是我們前面說的，已知結果，如何讓我們的結果出現的概率最大，當然用極大似然估計了。
在這裡插入圖片描述答案是p為0.6 我們從直覺上看也是這樣的