《機器學習:演算法原理和程式設計實踐》4:推薦系統原理
2、協同過濾及其演算法
協同過濾通過使用者和產品及使用者的偏好資訊產生推薦的策略,最基本的策略有兩種:一種是找到具有類似品位的人所喜歡的物品;另一種是從一個人喜歡的物品中找出類似的物品。這就是兩個最知名的類別推薦技術:基於使用者的推薦技術和基於物品的推薦技術,它們被稱為協同過濾。
協同過濾可以利用使用者和物品的資訊來預測使用者的好惡,並發現新的使用者還不知道的東西,形成促銷策略。這就完成了推薦系統的核心思想。
資料預處理:收集了使用者行為資料,我們還需要對資料進行一定的預處理,減燥和歸一化是最常用的方法,其目的是為了下一步的聚類。
為了減少計算的開銷,可以先對UI矩陣中的記錄進行聚類,根據聚類的結構在運用SVD演算法。
KMeans(也稱為K均值)是典型的基於距離的排他的劃分方法:給定一個n個物件的資料集,它可以構建資料的k個劃分,每個劃分就是一個聚類,並且k<=n,同時還要滿足兩個要求:每個組至少包含一個物件,每個物件必須屬於且僅屬於一個組。
SVD原理和計算:SVD隱語義模型最早在文字挖掘領域被提出,用於找到文字的隱含主題,也被稱為主題模型。相關的名詞有LSI、pLSA、LDA和Topic Model。隱語義模型的核心思想是通過隱含特徵(Latent Factor)計算使用者和物品的相似性。
相關文章
- 《機器學習:演算法原理和程式設計實踐》2:中文文字分類機器學習演算法程式設計文字分類
- 《機器學習:演算法原理和程式設計實踐》3:決策樹的發展機器學習演算法程式設計
- 圖片管理系統:原理、設計與實踐
- 推薦演算法在商城系統實踐演算法
- 機器學習演算法原理與程式設計學習(2)機器學習演算法程式設計
- 機器學習 — 推薦系統機器學習
- Spark推薦系統實踐Spark
- 推薦系統-矩陣分解原理詳解矩陣
- 《推薦系統實踐》筆記 01 推薦系統簡介筆記
- 機器學習之支援向量機原理和sklearn實踐機器學習
- 機器學習之決策樹原理和sklearn實踐機器學習
- 關於《推薦系統實踐》
- Java程式設計良心推薦——分散式架構原理解析Java程式設計分散式架構
- C#非同步程式設計:原理與實踐C#非同步程式設計
- 推薦系統[八]演算法實踐總結V0:騰訊音樂全民K歌推薦系統架構及粗排設計演算法架構
- 今日頭條推薦系統架構設計實踐(附下載)架構
- 推薦系統實踐自我評價
- 分解機(Factorization Machines)推薦演算法原理Mac演算法
- 孟巖談《C++程式設計原理與實踐》C++程式設計
- 百度基於雲原生的推薦系統設計與實踐
- 分治演算法基本原理和實踐演算法
- 浪潮之巔作者吳軍推薦序——《推薦系統實踐》
- 作業系統精髓設計原理 程式排程作業系統
- 推薦系統實踐學習系列(三)推薦系統冷啟動問題
- 《機器學習觀止——核心原理與實踐》之 K-NN 演算法機器學習演算法
- JDBC PreparedStatement 實現原理【推薦閱讀】JDBC
- 分散式系統硬體資源池原理和接入實踐分散式
- 個性化推薦系統實踐應用
- 推薦系統實踐 0x11 NeuralCF
- 19期推薦系統實踐學習(二)
- 編輯小記之《推薦系統實踐》
- 《推薦系統實踐》關於Latent Factor Model
- 京東LBS推薦演算法實踐演算法
- 系統設計:使用Scala、Spark和Hadoop構建推薦系統SparkHadoop
- Dart 非同步程式設計和原理Dart非同步程式設計
- 推薦系統一——深入理解YouTube推薦系統演算法演算法
- 分散式機器學習框架與高維實時推薦系統分散式機器學習框架
- 微機原理與系統設計筆記4 | 組合語言程式設計與其他指令筆記組合語言程式設計