聚類演算法
1、python 使用例子(包含程式碼和演算法說明):https://www.cnblogs.com/ahu-lichang/p/7161613.html
2、剛接觸機器學習這一個月我都做了什麼?(經典的機器學習步驟,不可誤入誤區):https://www.cnblogs.com/xing901022/p/6953696.html
3、K-means 演算法實現:文章介紹了 k-means 演算法的基本原理和 scikit 中封裝的 kmeans 庫的基本引數的含義:https://juejin.im/post/5daffd26e51d45249f6085a5#heading-0
4、聚類的例子 ppt,從資料準備,特徵選取,特徵提取,到聚類的詳細講解:https://cloud.tencent.com/developer/news/146955
5、k-means 例子:http://www.woshipm.com/ai/2102501.html/comment-page-1
6、k-modes 的介紹:http://sofasofa.io/forum_main_post.php?postid=1000500
7、k-modes 原始碼:https://github.com/nicodv/kmodes/blob/master/kmodes/kmodes.py
8、各類距離:https://www.cnblogs.com/WingPig/p/9760882.html
9、k-modes 應用:https://www.kaggle.com/ciujizuo/use-kmodes-to-do-clustering
K-Means 只能用於連續資料,而不能用於分類資料
因為 K-Means 演算法的核心是計算空間座標中,點與點之間的平均值,而我們知道只有連續資料可以被計算,分類資料即使使用 1234 來表示,也只是作一個代稱,而不可以進行數學計算。在計算之前,需先對資料進行歸一化處理
對資料進行歸一化處理是為了防止資料之間單位不一致,導致某些位數較大的引數擁有較高的權重,將所有的資料歸一化則可以將所有的引數權重調節成一致。當然,如果因為業務特點而需要將某些引數的權重調高或者調低,也可以根據實際情況來,畢竟演算法只是工具,真正起作用的還是使用演算法的人。K-Means 演算法對資料噪聲和離群值較為敏感
計算均值時需要所有的資料都參與,即使出現少量的離群資料,也會對均值產生極大的影響,所以在實際工作中使用演算法時,通常需要先對離群值進行資料清洗,排除離群值對最終結果的影響,然後再進行聚類計算。
相關文章
- 聚類(part3)--高階聚類演算法聚類演算法
- 聚類之K均值聚類和EM演算法聚類演算法
- 初探DBSCAN聚類演算法聚類演算法
- OPTICS聚類演算法原理聚類演算法
- 聚類演算法綜述聚類演算法
- 14聚類演算法-程式碼案例六-譜聚類(SC)演算法案例聚類演算法
- 09聚類演算法-層次聚類-CF-Tree、BIRCH、CURE聚類演算法
- 04聚類演算法-程式碼案例一-K-means聚類聚類演算法
- 可伸縮聚類演算法綜述(可伸縮聚類演算法開篇)聚類演算法
- 深度聚類演算法敘談聚類演算法
- Spark中的聚類演算法Spark聚類演算法
- 深度聚類演算法淺談聚類演算法
- 聚類演算法——DBSCAN演算法原理及公式聚類演算法公式
- 【Python機器學習實戰】聚類演算法(1)——K-Means聚類Python機器學習聚類演算法
- 聚類模型的演算法效能評價聚類模型演算法
- KMeans演算法與GMM混合高斯聚類演算法聚類
- 【Python機器學習實戰】聚類演算法(2)——層次聚類(HAC)和DBSCANPython機器學習聚類演算法
- 20分鐘學會DBSCAN聚類演算法聚類演算法
- MMM全連結聚類演算法實現聚類演算法
- 聚類演算法與K-means實現聚類演算法
- 聚類分析聚類
- 機器學習Sklearn系列:(五)聚類演算法機器學習聚類演算法
- 機器學習演算法筆記之8:聚類演算法機器學習演算法筆記聚類
- 部分聚類演算法簡介及優缺點分析聚類演算法
- DBSCAN聚類演算法(Density-Based Spatial Clustering of Applications with Noise)聚類演算法APP
- EM 演算法-對鳶尾花資料進行聚類演算法聚類
- 聚類的基本問題及兩個常用演算法聚類演算法
- 【無監督學習】2:DBSCAN聚類演算法原理聚類演算法
- 計算機如何感知大資料——聚類演算法計算機大資料聚類演算法
- 演算法金 | K-均值、層次、DBSCAN聚類方法解析演算法聚類
- 利用python的KMeans和PCA包實現聚類演算法PythonPCA聚類演算法
- ML.NET技術研究系列-2聚類演算法KMeans聚類演算法
- 聚類kmeans演算法在yolov3中的應用聚類演算法YOLO
- 用電負荷相關聚類演算法總結(1)聚類演算法
- 程式設計實現DBSCAN密度聚類演算法,並以西瓜資料集4.0為例進行聚類效果分析程式設計聚類演算法
- 學點高階技術:基於密度的聚類演算法——FDBSCAN演算法聚類演算法
- 演算法金 | 一文讀懂K均值(K-Means)聚類演算法演算法聚類
- 【scipy 基礎】--聚類聚類