K-Means |
K-Medoids |
初始據點隨機選取 |
初始隨機據點限定在樣本點中 |
使用Means(均值)作為聚點,對outliers(極值)很敏感 |
使用Medoids(中位數)作為聚點 |
對資料要求高,要求資料點處於歐式空間中 |
可適用類別(categorical)型別的特徵——(4) |
時間複雜度:O(n*k*t),t為迭代次數 |
時間複雜度:O(n^2 *k*t),t為迭代次數——(4) |
K-Means 演算法對小規模資料集較高效(efficient for smaller data sets) |
K-Medoids演算法對大規模資料效能更好,但伸縮性較差——(3) |
都有可能陷入區域性最優解的困境之中 |
|
K的含義相同,都需要開始人為設定簇數目 |
|
都是無監督演算法 |
References:
- Velmurugan T. Efficiency of K-Means and K-Medoids algorithms for clustering arbitrary data points[J]. International Journal of Computer Technology & Applications, 2012, 3(5): 1758-64.
- Arbin N, Mokhtar N Z, Suhaimi N S, et al. Comparative Analysis between K-Means and K-Medoids for Statistical Clustering[J].
- Velmurugan T, Santhanam T. Computational complexity between K-means and K-medoids clustering algorithms for normal and uniform distributions of data points[J]. Journal of computer science, 2010, 6(3): 363.
- http://blog.pluskid.org/?p=40
- https://www.youtube.com/watch?v=u1NtKPuXQKo