Python+sklearn使用DBSCAN聚類演算法案例一則

Python_小屋發表於2018-01-30

DBSCAN聚類演算法概述:

  • DBSCAN屬於密度聚類演算法,把類定義為密度相連物件的最大集合,通過在樣本空間中不斷搜尋最大集合完成聚類。

  • DBSCAN能夠在帶有噪點的樣本空間中發現任意形狀的聚類並排除噪點。

  • DBSCAN演算法不需要預先指定聚類數量,但對使用者設定的引數非常敏感。

  • 當空間聚類的密度不均勻、聚類間距差相差很大時,聚類質量較差。


DBSCAN演算法基本概念:

  • 核心物件:如果給定物件的半徑eps鄰域內樣本數量超過閾值min_samples,則稱為核心物件。

  • 邊界物件:在半徑eps內點的數量小於min_samples,但是落在核心點的鄰域內。

  • 噪聲物件:既不是核心物件也不是邊界物件的樣本。

  • 直接密度可達:如果物件q在核心物件p的eps鄰域內,則稱q從p出發是直接密度可達的。

  • 密度可達:集合中的物件鏈p1、p2、p3、...、pn,如果每個物件pi+1從pi出發都是直接密度可達的,則稱pn從p1出發是密度可達的。

  • 密度相連:集合中如果存在物件o使得物件p和q從o出發都是密度可達的,則稱物件p和q是互相密度相連的。


DBSCAN聚類演算法工作過程:

1)定義鄰域半徑eps和樣本數量閾值min_samples。
2)從樣本空間中抽取一個尚未訪問過的樣本p。
3)如果樣本p是核心物件,進入第4)步;否則返回第2)步。
4)找出樣本p出發的所有密度可達物件,構成一個聚類Cp(該聚類的邊界物件都是非核心物件),並標記這些物件為已訪問。
5)如果全部樣本都已訪問,演算法結束;否則返回第2)步。


Python+sklearn使用DBSCAN聚類演算法參考程式碼:

640?wx_fmt=png


聚類結果圖一:

640?wx_fmt=png


聚類結果圖二:

640?wx_fmt=png


聚類結果圖三:

640?wx_fmt=png



----------相關閱讀----------

1900頁Python系列PPT分享一:基礎知識(106頁)

1900頁Python系列PPT分享二:Python序列(列表、元組、字典、集合)(154頁)

1900頁Python系列PPT分享三:選擇與迴圈結構語法及案例(96頁)

1900頁Python系列PPT分享四:字串與正規表示式(109頁)

1900頁Python系列PPT分享五:函式設計與應用(134頁)

1900頁Python系列PPT分享六:物件導向程式設計(86頁)

1900頁Python系列PPT分享七:檔案操作(132頁)

報告PPT(163頁):基於Python語言的課程群建設探討與實踐


Python使用系統聚類方法進行資料分類案例一則

Python使用K-means聚類演算法進行分類案例一則

KNN分類演算法原理與Python+sklearn實現根據身高和體重對體型分類

Python+sklearn使用線性迴歸演算法預測兒童身高

使用線性迴歸擬合平面最佳直線及預測之Python+sklearn實現

Python使用系統聚類演算法對隨機元素進行分類

Python+KNN演算法判斷單詞相似度小案例

Python+tensorflow計算整數階乘的方法與侷限性

Python編寫的數字拼圖遊戲(含爬山演算法人機對戰功能)

詳解Python使用模擬退火演算法求解列表“最大值”

Python使用爬山演算法尋找序列“最大值”

Python使用tensorflow中梯度下降演算法求解變數最優值

Python+pandas實現時間序列資料擴充套件案例一則

Python+pandas+matplotlib資料分析與視覺化案例(附原始碼)

幾行Python程式碼生成飯店營業額模擬資料並儲存為CSV檔案

Python+pandas計算資料相關係數

兩行Python程式碼實現電影打分與推薦

Python繪製時間序列資料的時序圖、自相關圖和偏自相關圖

Python使用pandas對資料進行差分運算

Python使用pandas擴充套件庫DataFrame物件的pivot方法對資料進行透視轉換

Python使用pandas讀取Excel檔案資料和預處理小案例

使用Python內建集合物件和內建函式filter()過濾無效書評

Python資料分析擴充套件庫pandas的DataFrame排序方法小結

Pandas建立DataFrame物件的幾種常用方法

Python基於使用者協同過濾演算法的電影推薦程式碼demo



又一個學期結束了,送給在校大學生幾句話

淡定!不要因為納入了高考和二級考試甚至極個別小學課程就盲目誇大Python!

全國計算機等級考試二級Python考試大綱預測和分析

大家都在學Python,你和別人的差距在哪?

大學生們顫抖吧,中學生已經開始學Python了!

祝所有程式設計師1024節日快樂

學會提問,你就成功了一大半!

盤點那些讓人上火的提問方式(論如何讓交流更高效)


----------喜大普奔----------

1、董付國老師Python系列教材:

《Python程式設計基礎》

《Python程式設計(第2版)》

《Python可以這樣學》(本書已被引入臺灣發行繁體版)

《Python程式設計開發寶典》

《中學生可以這樣學Python》

董付國老師6本Python系列圖書閱讀指南

董付國老師6本Python系列教材被北大、復旦等近百所高校選作教材

熱烈慶祝《Python可以這樣學》在臺灣發行繁體版




2、董老師免費視訊地址: https://pan.baidu.com/s/1jJeAs8Q 密碼: px59


相關文章