k-means聚類

歸去_來兮發表於2023-01-30

原文網址 : https://www.cnblogs.com/flyup/p/17076998.html

一、概述

當前人工智慧技術實現的一種主要手段是機器學習，而機器學習能夠解決的問題主要有三種：分類、聚類、迴歸，有監督的是分類，無監督的是聚類。所謂聚類，就是以一定的方法將一堆樣本依它們本身的資料特性劃分成不同的簇類，以達成不同的技術目的，k-means就是這樣一種基礎聚類演算法。

二、演算法原理

對給定的樣本集，k-means基於迭代的思想，由聚集中心點劃定簇集，簇集反過來確定新的聚集中心點，週而復始，最終獲得最佳劃分的簇集。k-means中的k即想要劃定的簇數，它是一個超引數，需由人工事先指定。樣本的簇集劃歸由它與各個聚集中心點的距離來確定，劃歸到距離最近的那一個，其中距離的計算一般採用歐氏距離；新劃定的簇集則進一步計算質心作為新的聚集中心，質心即樣本向量的均值 \(c=\left( \bar{x^{(1)}},\bar{x^{(2)}},...,\bar{x^{(n)}} \right)\)

演算法描述
輸入：樣本集 \(T=\left\{ x_1,x_2,...,x_N \right\}\)，簇數k.
輸出：質心集合 \(C=\left\{ c_1,c_2,...,c_k \right\}\)，劃分樣本集\(D=\left\{ D_1,D_2,...,D_k \right\}\).
(1) 任意選定k個樣本作為初始聚集中心.
(2) 劃分簇類
1)對T中資料，計算與各個聚集中心的距離.樣本x與聚集中心c的距離為

\[d=\sqrt{\sum_{i=1}^{n}{(x^{(i)}-c^{(i)})^{2}}} \]

2)將樣本劃歸到離得最近的聚集中心，形成簇類。
(3)計算質心作為聚集中心
對簇S，質心

\[c=\left( c^{(1)},c^{(2)},...,c^{(n)} \right) \]

其中

\(c^{(i)}=\frac{1}{M}\sum_{s=1}^{M}{x_{s}^{(i)}}\),\(M=\left| S \right|\).
(4)重複(2)-(3)步，直至質心不發生偏移或達到指定的迭代次數.

三、python實現

'''
由sklearn實現kmeans聚類。
'''

import numpy as np
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")

#初始化資料集
d1 = np.random.rand(18,2)
d2 = 1.5 + np.random.rand(17,2)
d3 = 3 + np.random.rand(20,2)
data = np.concatenate((d1,d2,d3),axis=0)

#定義kmeans模型，n_clusters為指定的簇數k
kmr = KMeans(n_clusters=3)

#資料計算
fit_kmr = kmr.fit(data)

#獲取標籤結果
rs_labels = fit_kmr.labels_

#獲取每個簇類的中心點
rs_center_ids = fit_kmr.cluster_centers_

#繪圖
#繪製資料點
plt.scatter(data[:,0],data[:,1],c=rs_labels,alpha=0.5)
#繪製質心
plt.scatter(rs_center_ids[:,0],rs_center_ids[:,1],c='red')

plt.show()

執行結果：

End.

04聚類演算法-程式碼案例一-K-means聚類
2018-12-08
聚類演算法
【機器學習】K-means聚類分析
2022-06-30
機器學習聚類
聚類演算法與K-means實現
2021-09-08
聚類演算法
【Python機器學習實戰】聚類演算法（1）——K-Means聚類
2021-12-06
Python機器學習聚類演算法
從零開始學機器學習——K-Means 聚類
2024-11-20
機器學習聚類
k-medoids與k-Means聚類演算法的異同
2020-04-07
聚類演算法
K-Means聚類分析以及誤差平方和SSE（Python實現）
2024-11-14
聚類Python
機器學習—聚類5-1（K-Means演算法+瑞士捲）
2022-03-15
機器學習聚類演算法
為什麼說K-Means是基於距離的聚類演算法？
2018-03-12
聚類演算法
07 聚類演算法 - 程式碼案例三 - K-Means演算法和Mini Batch K-Means演算法效果評估
2018-12-08
聚類演算法BAT
演算法金 | 一文讀懂K均值（K-Means）聚類演算法
2024-06-05
演算法聚類
實踐2：如何使用word2vec和k-means聚類尋找相似的城市
2022-03-15
聚類
聚類分析
2024-03-20
聚類
聚類(part3)--高階聚類演算法
2020-10-11
聚類演算法
聚類之K均值聚類和EM演算法
2019-05-13
聚類演算法
06聚類演算法-程式碼案例二-K-Means演算法和MiniBatchK-Means演算法比較
2018-12-08
聚類演算法BAT
【火爐煉AI】機器學習020-使用K-means演算法對資料進行聚類分析
2018-09-03
AI機器學習演算法聚類
【scipy 基礎】--聚類
2023-11-01
聚類
聚類演算法
2020-04-26
聚類演算法
09聚類演算法-層次聚類-CF-Tree、BIRCH、CURE
2018-12-11
聚類演算法
聚類分析-案例：客戶特徵的聚類與探索性分析
2020-09-28
聚類特徵
unit3 文字聚類
2018-05-11
聚類
譜聚類原理總結
2022-01-18
聚類
密度聚類。Clustering by fast search and
2021-09-09
聚類AST
推薦系統中的產品聚類：一種文字聚類的方法
2020-01-02
聚類
Spark構建聚類模型（二）
2018-12-11
Spark聚類模型
聚類演算法綜述
2018-12-09
聚類演算法
sklearn建模及評估（聚類）
2019-09-03
聚類
譜聚類的python實現
2020-08-23
聚類Python
OPTICS聚類演算法原理
2020-05-14
聚類演算法
非完整資料聚類初探
2021-06-10
聚類
初探DBSCAN聚類演算法
2021-05-22
聚類演算法
資料探勘-層次聚類
2020-12-02
聚類
14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例
2018-12-16
聚類演算法
可伸縮聚類演算法綜述（可伸縮聚類演算法開篇）
2018-10-30
聚類演算法
【Python機器學習實戰】聚類演算法（2）——層次聚類(HAC)和DBSCAN
2021-12-16
Python機器學習聚類演算法
OpenCV計算機視覺學習（12）——影像量化處理&影像取樣處理（K-Means聚類量化，區域性馬賽克處理）
2020-11-27
OpenCV計算機視覺聚類
前端架構思想：聚類分層
2018-10-19
前端架構聚類

k-means聚類

一、概述

二、演算法原理

三、python實現

相關文章