常用聚類演算法以及演算法評價
聚類模型是一種非監督的學習方法,聚類的輸入是一組未標記的資料,聚類模型根據自身的距離或相似性將其化為若干組,劃分的原則是組內距離最小化而組間距離最大化。常見聚類方法見下表:
類別 | 主要演算法 |
---|---|
劃分方法 | k-Means,k-Medoids(k中心點),CLANRANS(基於選擇的演算法) |
層次分析方法 | BIRCH(平均迭代規約和聚類),CURE(代表點聚類),CHAMELEON(動態模型) |
基於密度的方法 | DBSCAN(高密度連線區域),DENCLUE(密度分佈函式),OPTICS(物件排序識別) |
基於網格的方法 | STING(統計資訊網路),SLIOUE(聚類高維空間),WAVE-CLUSTER(小波變化) |
基於模型的方法 | 統計學,神經網路 |
聚類分析演算法評價:
聚類分析目標是實現組內相似性高,組間相似性低。組內相似性越大,組間相似性越大,聚類效果越好。
purity評價法
purity評價法相對簡單,只需計算正確聚類數目佔總數的比例。purity(X,Y)=
1n \frac{1}{n}∑max|xk⋂yk| \sum max|x_k\bigcap y_k|RI評價法
RI=R+WR+M+D+W \frac{R+W}{R+M+D+W}R:應該在一起的兩個物件被正確分類了
W:不應該被聚在一類的兩個物件被正確分開了
M:不該放在一類的物件被錯誤的放在了一類
D:不應該分開的物件被錯誤的分開了- F值評價法
RI方法的衍生方法:
Fa F_a=(1+α2)prα2p+r \frac{(1+\alpha^2)pr}{\alpha^2 p+r},
其中,p=RR+M \frac{R}{R+M},r=RR+D \frac{R}{R+D}.
實際上,RI方法就是把準確率p和召回率看得同等重要。事實上,有時我們需要某一特性更多一點,這時候就適合使用F值方法。
相關文章
- 聚類模型的演算法效能評價聚類模型演算法
- 聚類演算法聚類演算法
- 分類模型的演算法效能評價模型演算法
- 聚類的基本問題及兩個常用演算法聚類演算法
- 聚類(part3)--高階聚類演算法聚類演算法
- 聚類之K均值聚類和EM演算法聚類演算法
- 聚類演算法綜述聚類演算法
- OPTICS聚類演算法原理聚類演算法
- 初探DBSCAN聚類演算法聚類演算法
- 14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例聚類演算法
- 可伸縮聚類演算法綜述(可伸縮聚類演算法開篇)聚類演算法
- 聚類演算法——DBSCAN演算法原理及公式聚類演算法公式
- Spark中的聚類演算法Spark聚類演算法
- 深度聚類演算法敘談聚類演算法
- 深度聚類演算法淺談聚類演算法
- 09聚類演算法-層次聚類-CF-Tree、BIRCH、CURE聚類演算法
- 04聚類演算法-程式碼案例一-K-means聚類聚類演算法
- 07 聚類演算法 - 程式碼案例三 - K-Means演算法和Mini Batch K-Means演算法效果評估聚類演算法BAT
- KMeans演算法與GMM混合高斯聚類演算法聚類
- 機器學習演算法筆記之8:聚類演算法機器學習演算法筆記聚類
- 【Python機器學習實戰】聚類演算法(1)——K-Means聚類Python機器學習聚類演算法
- 20分鐘學會DBSCAN聚類演算法聚類演算法
- MMM全連結聚類演算法實現聚類演算法
- 聚類演算法與K-means實現聚類演算法
- 迴歸模型的演算法效能評價模型演算法
- 機器學習Sklearn系列:(五)聚類演算法機器學習聚類演算法
- 【Python機器學習實戰】聚類演算法(2)——層次聚類(HAC)和DBSCANPython機器學習聚類演算法
- 演算法金 | 一文讀懂K均值(K-Means)聚類演算法演算法聚類
- 學點高階技術:基於密度的聚類演算法——FDBSCAN演算法聚類演算法
- 分類演算法的評估指標演算法指標
- 擁塞控制演算法的評價標準演算法
- Redis的常用淘汰策略以及演算法實現Redis演算法
- sklearn建模及評估(聚類)聚類
- 【無監督學習】2:DBSCAN聚類演算法原理聚類演算法
- DBSCAN聚類演算法(Density-Based Spatial Clustering of Applications with Noise)聚類演算法APP
- 計算機如何感知大資料——聚類演算法計算機大資料聚類演算法
- 部分聚類演算法簡介及優缺點分析聚類演算法
- EM 演算法-對鳶尾花資料進行聚類演算法聚類
- 06聚類演算法-程式碼案例二-K-Means演算法和MiniBatchK-Means演算法比較聚類演算法BAT