Python k-均值聚類演算法二維例項

qq_24311495發表於2018-02-10

k-均值聚類演算法二維例項，不多解釋，解釋就是掩飾，複製貼上即可執行。

import time
import numpy as np
import random
import matplotlib.pyplot as plt
import operator

def func01():    #生成二維隨機點

    #random.seed(1)
    kjz1=[[random.randint(50,100),random.randint(50,100)] for j in range(0,200)]
    kjz1.extend([[random.randint(150,200),random.randint(150,200)] for j in range(0,200)])
    kjz1.extend([[random.randint(60,110),random.randint(150,200)] for j in range(0,200)])
    kjz1.extend([[random.randint(130,180),random.randint(50,100)] for j in range(0,200)])
    kjz1.extend([[random.randint(150,200),random.randint(250,300)] for j in range(0,200)])
    kjz1.extend([[random.randint(60,110),random.randint(250,300)] for j in range(0,200)])
    return kjz1

def func02(kjz2w): #繪圖

    if kjz2w!=[]:
        colors=['b','g','r','c','m','y','k'];s=0;
        for j in kjz2w:
            for i in j:
                plt.plot(i[0], i[1], color=colors[s%len(colors)], marker='.')
            s=s+1;
        plt.ion();plt.show();plt.pause(5);plt.close();

def func03(kjz1,k):    #計算初始均值，並返回初始分組

    minxy=np.min(kjz1,axis=0).tolist();maxxy=np.max(kjz1,axis=0).tolist();
    xjg=(maxxy[0]-minxy[0])/k;yjg=(maxxy[1]-minxy[1])/k;
    meanxy=[];meanxy.append([minxy[0],minxy[1]]);meanxy.append([maxxy[0],maxxy[1]]);
    for j in range(1,k-1):
        meanxy.append([minxy[0]+xjg*j,minxy[1]+yjg*j])
    kjz2wxy2=[[] for j in range(0,len(meanxy))];
    for j in kjz1:
        s=0;lslb=[];
        for k in meanxy:
            lslb.append([s,(j[0]-k[0])**2+(j[1]-k[1])**2]);s=s+1; #一個座標一組
        lslb.sort(reverse=False,key=operator.itemgetter(1))  #正序
        kjz2wxy2[lslb[0][0]].append(j)
    return kjz2wxy2

def func05(lb2): #剔除空列表

    j=0;
    while(True):
        if len(lb2[j])<=0:
            lb2.pop(j)
        else:
            j=j+1;
        if j>=len(lb2):
            break
    return lb2

def func06(kjz2wxy): #求組合中心(均值)

    meanxy=[];
    for j in kjz2wxy:
        meanxy.append(np.mean(j,axis=0).tolist())
    kjz2wxy2=[[] for j in range(0,len(meanxy))];
    for j in kjz2wxy:
        for i in j: #點
            s=0;lslb=[];
            for k in meanxy:
                lslb.append([s,(i[0]-k[0])**2+(i[1]-k[1])**2]);s=s+1;
            lslb.sort(reverse=False,key=operator.itemgetter(1))  #正序
            kjz2wxy2[lslb[0][0]].append(i)
    kjz2wxy2=func05(kjz2wxy2)
    return kjz2wxy2,meanxy

def func07(kjz2w,fz):

    kjz2wxy=func03(kjz2w,fz) #座標列表，分組，0-按照x軸均分
    j=0;
    while(True):
        kjz2wxy,meanxy=func06(kjz2wxy)
        if j>0 and meanxy==meanxy2:
            break
        meanxy2=meanxy.copy();
        j=j+1;
    print('迭代%d次' % (j))
    func02(kjz2wxy) #繪圖

if __name__=='__main__':

    start=time.time();
    for j in range(0,10):
        kjz2w=func01()
        func07(kjz2w,6) #分6組

    print('Time used:',int((time.time()-start)/60*10)/10,'分鐘')

這裡寫圖片描述
上圖是初始均值選取比較好的時候的情況，還有些情況是下面這樣的。

今天還寫了一種畫蛇添足的演算法，從一維演算法過度來的，就像下面這樣的。

import time
import numpy as np
import random
import matplotlib.pyplot as plt
import operator


def func01():    #生成二維隨機點

    random.seed(1)
    kjz1=[[random.randint(50,100),random.randint(50,100)] for j in range(0,200)]
    kjz1.extend([[random.randint(150,200),random.randint(150,200)] for j in range(0,200)])
    kjz1.extend([[random.randint(60,110),random.randint(150,200)] for j in range(0,200)])
    kjz1.extend([[random.randint(130,180),random.randint(50,100)] for j in range(0,200)])
    kjz1.extend([[random.randint(150,200),random.randint(250,300)] for j in range(0,200)])
    kjz1.extend([[random.randint(60,110),random.randint(250,300)] for j in range(0,200)])
    #繪圖
    plt.xlabel('x-axis')
    plt.ylabel('y-axis')  
    for j in kjz1:
        plt.plot(j[0], j[1], color='b', marker='.', label='y1 data')
    plt.ion();plt.show();plt.pause(1);plt.close();

    return kjz1

def func02(kjz1,k,axis):    #k個均值分k份

    kjz1.sort(reverse=False,key=operator.itemgetter(1-axis))  #正序
    kjz1.sort(reverse=False,key=operator.itemgetter(axis))  #正序
    wb2=kjz1.copy();
    #初始均勻分組
    xlb=[];a=round(len(wb2)/k);b=len(wb2)%k;
    for j in range(1,k+1):
        xlb.append(j*a)
        if j==k:
            xlb[j-1]=xlb[j-1]+b;
    j=0;wb1=[];
    for j in range(0,k):
        wb1.append([])
    i=0;j=0;
    while(i<=len(wb2)-1):
        wb1[j].append(wb2[i]);
        if i>=xlb[j]-1:
            j=j+1;
        i=i+1;
    kj1=means(wb1,axis);#初始分組均值

    bj=1;
    while(True):
        wb2=kjz1.copy();
        if bj!=1:
            kj1=kj2.copy();
        wb3=[];
        for j in range(0,k-1):
            wb3.append([])
        for j in range(0,k-1):
            i=0;
            while(True):
                if wb2[i][axis]<=kj1[j]:
                    wb3[j].append(wb2.pop(i));
                else:
                    i=i+1;
                if i>=len(wb2):
                    break
        wb3.append(wb2)
        for j in wb3:
            if len(j)<=0:
                print('分組出現空組，返回[]');return []
        kj2=means(wb3,axis);#過程均值
        if bj==2:
            if kj1==kj2:
                break
        bj=2;
    return wb3

def means(lb1,axis):    #計算均值

    mean1=[];mean2=[];std1=[];
    for j in lb1:
        mean1.append(np.mean(j,axis=0).tolist())
    for j in range(1,len(mean1)):
        mean2.append(np.mean([mean1[j-1][axis],mean1[j][axis]])) #分組均值使用各組的均值
    return mean2

def func03(kjz2w): #繪圖

    if kjz2w!=[]:
        colors=['b','g','r','c','m','y','k'];s=0;
        for j in kjz2w:
            for i in j:
                plt.plot(i[0], i[1], color=colors[s%len(colors)], marker='.', label='y1 data')
            s=s+1;
        plt.ion();plt.show();plt.pause(3);plt.close();

def func04(kjz2wx,kjz2wy): #x,y 組整合

    kjz2wxy=[[] for j in range(0,len(kjz2wx)*len(kjz2wy))];k=0;
    for j in kjz2wx:
        for i in kjz2wy:
            for a in j:
                if a in i:
                    kjz2wxy[k].append(a);
            k=k+1;
    kjz2wxy=func05(kjz2wxy)
    return kjz2wxy


def func05(lb2): #組合迭代

    j=0;
    while(True):
        if len(lb2[j])<=0:
            lb2.pop(j)
        else:
            j=j+1;
        if j>=len(lb2):
            break
    return lb2


def func06(kjz2wxy): #組合迭代

    #求組合中心(均值)
    meanxy=[];
    for j in kjz2wxy:
        meanxy.append(np.mean(j,axis=0).tolist())
    kjz2wxy2=[[] for j in range(0,len(meanxy))];
    for j in kjz2wxy:
        for i in j: #點
            s=0;lslb=[];
            for k in meanxy:
                lslb.append([s,(i[0]-k[0])**2+(i[1]-k[1])**2]);s=s+1;
            lslb.sort(reverse=False,key=operator.itemgetter(1))  #正序
            kjz2wxy2[lslb[0][0]].append(i)
    kjz2wxy2=func05(kjz2wxy2)
    return kjz2wxy2,meanxy

def func07(kjz2w):

    kjz2wx=func02(kjz2w,2,0) #列表，分組數，x軸0，y軸1
    func03(kjz2wx) #繪圖

    kjz2wy=func02(kjz2w,3,1)
    func03(kjz2wy) #繪圖

    kjz2wxy=func04(kjz2wx,kjz2wy)
    func03(kjz2wxy) #繪圖

    #kjz2wxy=func06(kjz2wxy)
    j=0;
    while(True):
        kjz2wxy,meanxy=func06(kjz2wxy)
        if j>0 and meanxy==meanxy2:
            break
        meanxy2=meanxy.copy();
        j=j+1;
    print('迭代%d次' % (j))
    func03(kjz2wxy) #繪圖

if __name__=='__main__':

    start=time.time();
    kjz2w=func01()

    func07(kjz2w)

    print('Time used:',int((time.time()-start)/60*10)/10,'分鐘')

K-均值聚類分析
2012-04-17
聚類
k-均值聚類簡介
2018-02-07
聚類
演算法金 | K-均值、層次、DBSCAN聚類方法解析
2024-06-23
演算法聚類
用K-均值聚類來探索顧客細分
2015-12-06
聚類
聚類之K均值聚類和EM演算法
2019-05-13
聚類演算法
機器學習經典聚類演算法 —— k-均值演算法（附python實現程式碼及資料集）
2019-07-31
機器學習聚類演算法Python
K-鄰近均值演算法
2020-10-08
演算法
《機器學習實戰》二分-kMeans演算法（二分K均值聚類）
2015-10-07
機器學習演算法聚類
C均值聚類 C實現 Python實現
2020-12-05
聚類Python
《機器學習實戰》kMeans演算法（K均值聚類演算法）
2015-10-07
機器學習演算法聚類
【機器學習】：Kmeans均值聚類演算法原理(附帶Python程式碼實現)
2001-01-01
機器學習聚類演算法Python
演算法雜貨鋪：k均值聚類(K-means)
2015-04-28
演算法聚類
如何在BigQueryML中使用K-均值聚類來更好地理解和描述資料（附程式碼）
2019-05-14
聚類
演算法金 | 一文讀懂K均值（K-Means）聚類演算法
2024-06-05
演算法聚類
python 類和例項
2021-09-09
Python
【Python機器學習實戰】聚類演算法（1）——K-Means聚類
2021-12-06
Python機器學習聚類演算法
第十篇：K均值聚類(KMeans)
2017-05-20
聚類
【Python機器學習實戰】聚類演算法（2）——層次聚類(HAC)和DBSCAN
2021-12-16
Python機器學習聚類演算法
聚類演算法
2020-04-26
聚類演算法
Python:K-近鄰演算法
2017-12-06
Python演算法
聚類(part3)--高階聚類演算法
2020-10-11
聚類演算法
線上生成二維碼程式碼例項
2017-04-18
【火爐煉AI】機器學習022-使用均值漂移聚類演算法構建模型
2018-09-04
AI機器學習聚類演算法模型
Python 動態新增例項屬性，例項方法，類屬性，類方法
2024-06-29
Python
Python學習：類和例項
2018-08-08
Python
機器學習（五）：混合高斯聚類GMM（求聚類標籤）+PCA降維（3維降2維）習題
2023-04-08
機器學習聚類PCA
機器學習入門|聚類（二）
2018-02-01
機器學習聚類
OPTICS聚類演算法原理
2020-05-14
聚類演算法
初探DBSCAN聚類演算法
2021-05-22
聚類演算法
聚類演算法綜述
2018-12-09
聚類演算法
DBSCAN密度聚類演算法
2016-12-22
聚類演算法
BIRCH聚類演算法原理
2016-12-14
聚類演算法
聚類之dbscan演算法
2017-06-04
聚類演算法
Meanshift，聚類演算法
2017-07-31
聚類演算法
02聚類演算法-相似度距離公式、維度災難
2018-12-08
聚類演算法公式
python類例項化如何實現
2021-09-11
Python
14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例
2018-12-16
聚類演算法
9.1.6 DBSCAN聚類演算法————機器學習實戰第二版
2020-11-18
聚類演算法機器學習

Python k-均值聚類演算法二維例項

相關文章