14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例

白爾摩斯發表於2018-12-16

原文網址 : https://flycode.co/archives/189797

需求使用scikit的相關API建立模擬資料，然後使用譜聚類演算法進行資料聚類操作，並比較演算法在不同引數情況下的聚類效果。

常規操作：

import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import sklearn.datasets as ds
import matplotlib.colors
import warnings
from sklearn.cluster import SpectralClustering#引入譜聚類
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import euclidean_distances

## 設定屬性防止中文亂碼及攔截異常資訊
mpl.rcParams[`font.sans-serif`] = [u`SimHei`]
mpl.rcParams[`axes.unicode_minus`] = False

warnings.filterwarnings(`ignore`, category=FutureWarning)

1、建立模擬資料

N = 1000
centers = [[1, 2], [-1, -1], [1, -1], [-1, 1]]
#符合高斯分佈的資料集
data1, y1 = ds.make_blobs(N, n_features=2, centers=centers, 
    cluster_std=(0.75,0.5,0.3,0.25), random_state=0)
data1 = StandardScaler().fit_transform(data1)
dist1 = euclidean_distances(data1, squared=True)

2、資料2 – 圓形資料集

t = np.arange(0, 2 * np.pi, 0.1)
data2_1 = np.vstack((np.cos(t), np.sin(t))).T
data2_2 = np.vstack((2*np.cos(t), 2*np.sin(t))).T
data2_3 = np.vstack((3*np.cos(t), 3*np.sin(t))).T
data2 = np.vstack((data2_1, data2_2, data2_3))
y2 = np.vstack(([0] * len(data2_1), [1] * len(data2_2), [2] * len(data2_3)))

datasets = [(data1, y1), (data2, y2.ravel())]

def expandBorder(a, b):
    d = (b - a) * 0.1
    return a-d, b+d

3、畫圖

colors = [`r`, `g`, `b`, `y`]
cm = mpl.colors.ListedColormap(colors)

for i,(X, y) in enumerate(datasets):
    x1_min, x2_min = np.min(X, axis=0)
    x1_max, x2_max = np.max(X, axis=0)
    x1_min, x1_max = expandBorder(x1_min, x1_max)
    x2_min, x2_max = expandBorder(x2_min, x2_max)
    n_clusters = len(np.unique(y))
    plt.figure(figsize=(12, 8), facecolor=`w`)
    plt.suptitle(u`譜聚類--資料%d` % (i+1), fontsize=20)
    plt.subplots_adjust(top=0.9,hspace=0.35)

    #譜聚類的建模
    gamma_list = [0.1,5,10]
    nclusters = [4,3]
    for i, ncluster in enumerate(nclusters):
        for j,gamma_value in enumerate(gamma_list):
            spectral = SpectralClustering(n_clusters=ncluster,
                gamma = gamma_value, affinity=`laplacian`,assign_labels=`kmeans`)
            y_hat = spectral.fit_predict(X)
            unique_y_hat = np.unique(y_hat)


            ## 開始畫圖
            plt.subplot(2,3,j+1)
            for k, col in zip(unique_y_hat, colors):
                cur = (y_hat == k)
                plt.scatter(X[cur, 0], X[cur, 1], s=40, c=col, edgecolors=`k`)
            plt.xlim((x1_min, x1_max))
            plt.ylim((x2_min, x2_max))
            plt.grid(True)
            plt.title(`$gamma$ = %.2f ，聚類簇數目：%d` % (gamma_value, n_clusters), 
                fontsize=16)

    plt.subplot(234)
    plt.scatter(X[:, 0], X[:,1], c=y, s=30, cmap=cm, edgecolors=`none`)
    plt.xlim((x1_min, x1_max))
    plt.ylim((x2_min, x2_max))
    plt.title(`原始資料，聚類簇數目:%d` % len(np.unique(y)))
    plt.grid(True)
    plt.show()

04聚類演算法-程式碼案例一-K-means聚類
2018-12-08
聚類演算法
聚類演算法
2020-04-26
聚類演算法
聚類(part3)--高階聚類演算法
2020-10-11
聚類演算法
聚類之K均值聚類和EM演算法
2019-05-13
聚類演算法
06聚類演算法-程式碼案例二-K-Means演算法和MiniBatchK-Means演算法比較
2018-12-08
聚類演算法BAT
聚類分析-案例：客戶特徵的聚類與探索性分析
2020-09-28
聚類特徵
聚類演算法綜述
2018-12-09
聚類演算法
OPTICS聚類演算法原理
2020-05-14
聚類演算法
初探DBSCAN聚類演算法
2021-05-22
聚類演算法
09聚類演算法-層次聚類-CF-Tree、BIRCH、CURE
2018-12-11
聚類演算法
07 聚類演算法 - 程式碼案例三 - K-Means演算法和Mini Batch K-Means演算法效果評估
2018-12-08
聚類演算法BAT
可伸縮聚類演算法綜述（可伸縮聚類演算法開篇）
2018-10-30
聚類演算法
Spark中的聚類演算法
2020-09-27
Spark聚類演算法
深度聚類演算法敘談
2021-05-18
聚類演算法
深度聚類演算法淺談
2021-04-15
聚類演算法
譜聚類原理總結
2022-01-18
聚類
聚類演算法——DBSCAN演算法原理及公式
2020-05-20
聚類演算法公式
【Python機器學習實戰】聚類演算法（1）——K-Means聚類
2021-12-06
Python機器學習聚類演算法
譜聚類的python實現
2020-08-23
聚類Python
聚類模型的演算法效能評價
2024-06-27
聚類模型演算法
KMeans演算法與GMM混合高斯聚類
2023-04-16
演算法聚類
【Python機器學習實戰】聚類演算法（2）——層次聚類(HAC)和DBSCAN
2021-12-16
Python機器學習聚類演算法
20分鐘學會DBSCAN聚類演算法
2024-07-16
聚類演算法
MMM全連結聚類演算法實現
2024-05-25
聚類演算法
聚類演算法與K-means實現
2021-09-08
聚類演算法
聚類分析
2024-03-20
聚類
機器學習Sklearn系列：（五）聚類演算法
2021-07-22
機器學習聚類演算法
程式設計實現DBSCAN密度聚類演算法，並以西瓜資料集4.0為例進行聚類效果分析
2022-12-01
程式設計聚類演算法
機器學習演算法筆記之8：聚類演算法
2020-04-06
機器學習演算法筆記聚類
聚類的基本問題及兩個常用演算法
2019-01-25
聚類演算法
【無監督學習】2：DBSCAN聚類演算法原理
2018-04-09
聚類演算法
DBSCAN聚類演算法（Density-Based Spatial Clustering of Applications with Noise）
2020-02-24
聚類演算法APP
計算機如何感知大資料——聚類演算法
2018-04-04
計算機大資料聚類演算法
部分聚類演算法簡介及優缺點分析
2023-01-10
聚類演算法
EM 演算法-對鳶尾花資料進行聚類
2020-12-14
演算法聚類
【火爐煉AI】機器學習027-專案案例：用聚類演算法建立客戶細分模型
2018-09-07
AI機器學習聚類演算法模型
用電負荷相關聚類演算法總結（1）
2018-09-09
聚類演算法
利用python的KMeans和PCA包實現聚類演算法
2019-09-15
PythonPCA聚類演算法

14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例

常規操作：

1、建立模擬資料

2、 資料2 – 圓形資料集

3、畫圖

相關文章

2、資料2 – 圓形資料集