K近鄰演算法

無風聽海發表於2022-03-03

1、原理

         工 作 原 理 是 : 存 在 一 個 樣 本 資料 集 合 , 也 稱 作訓練 樣 本 集 , 並 且 樣 本 集 中 每 個 數 據 都 存 在 標 籤 , 即 我 們 知 道 樣 本 集 中 每 一 數 據與 所 屬 分 類 的 對 應關係 。輸 人 沒 有 標 籤 的 新 數 據 後 , 將 新 數 據 的 每 個 特 徵 與 樣 本 集 中 數 據 對 應的特 徵 進 行 比較 , 然 後 算 法 提 取 樣 本 集 中 特 徵 最 相 似 數 據 ( 最 近 鄰 ) 的 分 類 標 籤 。一 般 來 說 , 我 們只 選 擇 樣 本 數 據 集 中 前 & 個 最 相 似 的 數 據 ,這 就 是 &- 近 鄰 算 法 中 & 的 出 處 , 通 常 * 是 不 大 於 20 的 整 數 。
         最 後 , 選 擇 & 個 最 相 似 數 據 中 出 現 次 數 最 多 的 分 類 , 作 為 新 數 據 的 分 類 。

2、優缺點和適用範圍

優 點 : 精 度 高 、 對 異 常 值 不 敏 感 、 無 數 據 輸 入 假 定 。
缺 點 : 計 算 復 雜 度 高 、 空 間 復 雜 度 高 。
適 用 數 據 範 圍 : 數 值 型 和 標 稱 型 。

3、例子


判斷未知的?電影屬於什麼型別


相關文章