圖說十大資料探勘演算法(一)K最近鄰演算法

贪心科技發表於2019-01-25

大資料演算法

用官方的話來說，所謂K近鄰演算法，即是給定一個訓練資料集，對新的輸入例項，在訓練資料集中找到與該例項最鄰近的K個例項（也就是上面所說的K個鄰居），這K個例項的多數屬於某個類，就把該輸入例項分類到這個類中。

如果你之前沒有學習過K最近鄰演算法，那今天幾張圖，讓你明白什麼是K最近鄰演算法。

圖說開始

先來一張圖，請分辨它是什麼水果

圖說十大資料探勘演算法(一)K最近鄰演算法

很多同學不假思索，直接回答：“菠蘿”！！！

仔細看看同學們，這是菠蘿麼？那再看下邊這這張圖。

圖說十大資料探勘演算法(一)K最近鄰演算法

這兩個水果又是什麼呢？

這就是菠蘿與鳳梨的故事，下邊即將用菠蘿和鳳梨，給大家講述怎麼用一個演算法來知道這是個什麼水果的過程，也就是什麼是K最近鄰演算法。

（給非吃貨同學們補充一個生活小常識，菠蘿的葉子有刺，鳳梨沒有。菠蘿的凹槽處是黃色的，而鳳梨的凹槽處是綠色的，以後千萬不要買錯哦！！！）

圖說十大資料探勘演算法(一)K最近鄰演算法

上邊這張圖中，我們定義了兩個維度的特徵：

一個是葉子是否有刺
一個是凹槽處是否的顏色

問：一個新的水果來了，我們怎麼判斷他是什麼水果呢？

圖說十大資料探勘演算法(一)K最近鄰演算法

方法如下：

圖說十大資料探勘演算法(一)K最近鄰演算法

（看這個神祕水果與哪個水果的舉例近。同等舉例，看離它最近的水果中，哪個水果多）

根據上圖中，我們判斷，這個神祕水果那就是菠蘿啦，原因是離它近的水果中菠蘿比鳳梨多。

相信到這裡，大家都已經明白了什麼是K最近鄰演算法了吧！

下邊來具體學習一下距離的計算

假設我們有3中不知名的水果

圖說十大資料探勘演算法(一)K最近鄰演算法

我們現在根據其大小和顏色的特徵，把它們放入圖表中

圖說十大資料探勘演算法(一)K最近鄰演算法

那如我們如何判斷他們有多像呢？

圖說十大資料探勘演算法(一)K最近鄰演算法

具體的計算，可以使用畢達哥拉斯公式

圖說十大資料探勘演算法(一)K最近鄰演算法

那現在來計算水果A和水果B之間的距離

圖說十大資料探勘演算法(一)K最近鄰演算法

最後的計算結果為1

那麼同理，如果要讓你去做一個推薦系統，我們可以把人的使用者畫像放在一個表格裡

圖說十大資料探勘演算法(一)K最近鄰演算法

如果我們給其中一個人推薦他可能感興趣的書、電影、美食等，就可以看一下離他最近距離的這些人都在做什麼，然後就套用下邊的公式就可以了

圖說十大資料探勘演算法(一)K最近鄰演算法

無論多少維度，直接套用就可以了。

圖說演算法，是不是非常的簡單就理解了KNN。

祝大家學習愉快，歡迎轉發。

資料探勘十大演算法
2019-02-21
演算法
資料探勘十大經典演算法
2020-11-03
演算法
圖資料探勘：社群檢測演算法（一）
2021-12-08
演算法
K近鄰演算法
2022-03-03
演算法
K - 近鄰演算法
2020-12-19
演算法
k-近鄰演算法
2018-06-11
演算法
常用資料探勘演算法
2024-10-13
演算法
分類演算法-k 鄰近演算法
2020-01-19
演算法
資料探勘 ReliefF和K-means演算法的應用
2021-09-09
演算法
K-鄰近均值演算法
2020-10-08
演算法
python 資料探勘演算法簡要
2018-09-20
Python演算法
機器學習演算法之K近鄰演算法
2021-06-06
機器學習演算法
機器學習——K近鄰演算法
2019-02-16
機器學習演算法
K-最近鄰法(KNN)簡介
2018-10-04
KNN
資料探勘與分析概念與演算法
2018-06-05
演算法
機器學習演算法——kNN（k-近鄰演算法）
2020-10-12
機器學習演算法KNN
資料探勘領域十大經典演算法之—樸素貝葉斯演算法（附程式碼）
2018-09-18
演算法
k近鄰演算法的實現：kd樹
2018-05-10
演算法
機器學習-K近鄰演算法-KNN
2024-04-27
機器學習演算法KNN
資料探勘演算法跟資料結構中的演算法有區別嗎
2019-05-09
演算法資料結構
TigerGraph開源十大圖資料庫演算法庫
2018-12-24
資料庫演算法
K近鄰演算法：機器學習萌新必學演算法
2020-10-30
演算法機器學習
機器學習-11-k近鄰演算法
2020-10-29
機器學習演算法
程式設計師必須知道機器學習與資料探勘十大經典演算法：PageRank演算法篇
2019-08-30
程式設計師機器學習演算法
機器學習演算法（三）：K近鄰(k-nearest neighbors)初探
2020-12-21
機器學習演算法REST
【資料探勘】C3.0、C4.5、CART演算法
2020-10-10
演算法
資料探勘——KNN演算法（手寫數字分類）
2020-12-20
KNN演算法
Python反反爬系列(一)----K近鄰演算法與CSS動態字型加密
2019-12-30
Python演算法CSS加密
Frequent Pattern 資料探勘關聯規則演算法（Aprior演算法) FT-Tree
2018-03-26
演算法
機器學習經典分類演算法 —— k-近鄰演算法（附python實現程式碼及資料集）
2019-07-29
機器學習演算法Python
機器學習實戰筆記-k近鄰演算法
2018-07-17
機器學習筆記演算法
K-近鄰演算法介紹與程式碼實現
2019-07-05
演算法
資料探勘之KMeans演算法應用與簡單理解
2019-07-23
演算法
資料探勘的十大經典演算法，總算是講清楚了，想提升自己的趕快收藏
2021-09-22
演算法
圖的鄰接表演算法---（附完整程式碼）
2018-08-15
演算法
《資料結構與演算法》之十大基礎排序演算法
2023-05-20
資料結構演算法排序
機器學習實戰----k值近鄰演算法（Python語言）
2021-09-09
機器學習演算法Python
機器學習演算法-K近鄰（KNN）演算法（三）：馬絞痛資料--kNN資料預處理+kNN分類pipeline（程式碼附詳細註釋）
2020-12-29
機器學習演算法KNN

圖說十大資料探勘演算法(一)K最近鄰演算法

圖說開始

下邊來具體學習一下距離的計算

相關文章