k-medoids與k-Means聚類演算法的異同

weixin_34104341發表於2020-04-07

K-Means

K-Medoids

初始據點隨機選取

初始隨機據點限定在樣本點中

使用Means(均值)作為聚點,對outliers(極值)很敏感

使用Medoids(中位數)作為聚點

對資料要求高,要求資料點處於歐式空間中

可適用類別(categorical)型別的特徵——(4)

時間複雜度:O(n*k*t),t為迭代次數

時間複雜度:O(n^2 *k*t),t為迭代次數——(4)

 K-Means 演算法對小規模資料集較高效(efficient  for  smaller  data  sets)

K-Medoids演算法對大規模資料效能更好,但伸縮性較差——(3)

都有可能陷入區域性最優解的困境之中

K的含義相同,都需要開始人為設定簇數目

都是無監督演算法

References:

  1. Velmurugan T. Efficiency of K-Means and K-Medoids algorithms for clustering arbitrary data points[J]. International Journal of Computer Technology & Applications, 2012, 3(5): 1758-64.
  2. Arbin N, Mokhtar N Z, Suhaimi N S, et al. Comparative Analysis between K-Means and K-Medoids for Statistical Clustering[J].
  3. Velmurugan T, Santhanam T. Computational complexity between K-means and K-medoids clustering algorithms for normal and uniform distributions of data points[J]. Journal of computer science, 2010, 6(3): 363.
  4. http://blog.pluskid.org/?p=40
  5. https://www.youtube.com/watch?v=u1NtKPuXQKo

 

轉載於:https://www.cnblogs.com/190260995xixi/p/5954921.html

相關文章