粒子濾波(Particle Filter)的通俗解釋

Regnaiq發表於2017-03-15

其實,粒子叫作估計器estimator。估計過去叫平滑smoothing,估計未來叫預測prediction,估計當前值才叫濾波filtering。粒子濾波演算法源於蒙特卡洛思想,即以某事件出現的頻率來指代該事件的概率。通俗的講,粒子濾波也是能用已知的一些資料預測未來的資料。我們知道,科爾曼濾波限制噪聲時服從高斯分佈的,但是粒子濾波可以不侷限於高斯噪聲,原理上粒子濾波可以駕馭所有的非線性、非高斯系統。

一個比喻

某年月,警方(跟蹤程式)要在某個城市的茫茫人海(取樣空間)中跟蹤尋找一個罪犯(目標),警方採用了粒子濾波的方法。

1. 初始化:

警方找來了一批警犬(粒子),並且讓每個警犬預先都聞了罪犯留下來的衣服的味道(為每個粒子初始化狀態向量S0),然後將警犬均勻佈置到城市的各個區(均勻分佈是初始化粒子的一種方法,另外還有諸如高斯分佈,即:將警犬以罪犯留衣服的那個區為中心來擴充套件分佈開來)。

2. 搜尋:

每個警犬都聞一聞自己位置的人的味道(粒子狀態向量Si),並且確定這個味道跟預先聞過的味道的相似度(計算特徵向量的相似性),這個相似度的計算最簡單的方法就是計算一個歐式距離(每個粒子i對應一個相似度Di),然後做歸一化(即:保證所有粒子的相似度之和為1)。

3. 決策:

總部根據警犬們發來的味道相似度確定罪犯出現的位置(概率上最大的目標):最簡單的決策方法為哪個味道的相似度最高,那個警犬處的人就是目標。

4. 重取樣:

總部根據上一次的決策結果,重新佈置下一輪警犬分佈(重取樣過程)。最簡單的方法為:把相似度比較小的地區的警犬抽調到相似度高的地區。

上述,2,3,4過程重複進行,就完成了粒子濾波跟蹤演算法的全過程。


 粒子濾波的核心思想是隨機取樣+重要性重取樣。既然不知道目標在哪裡,那我就隨機的放狗(隨機取樣)。放完狗後,根據特徵相似度計算每個地區人和罪犯的相似度,然後在重要的地方再多放狗,不重要的地方就少放狗(重要性取樣)。


參考:

http://www.cnblogs.com/konlil/archive/2012/02/05/2339142.html

相關文章