混合高斯模型GMM是指對樣本的概率密度分佈進行估計,而估計採用的模型(訓練模型)是幾個高斯模型的加權和(具體是幾個要在模型訓練前建立好)。每個高斯模型就代表了一個類(一個Cluster)。對樣本中的資料分別在幾個高斯模型上投影,就會分別得到在各個類上的概率。然後我們可以選取概率最大的類所為判決結果。
理論上可以通過增加Model的個數,用GMM近似任何概率分佈。在做引數估計的時候,常採用的是最大似然方法。最大似然法就是使樣本點在估計的概率密度函式上的概率值最大。對於高維資料,GMM可能會表現不佳。