《機器學習:演算法原理和程式設計實踐》4:推薦系統原理

CopperDong發表於2018-07-07





2、協同過濾及其演算法

     協同過濾通過使用者和產品及使用者的偏好資訊產生推薦的策略,最基本的策略有兩種:一種是找到具有類似品位的人所喜歡的物品;另一種是從一個人喜歡的物品中找出類似的物品。這就是兩個最知名的類別推薦技術:基於使用者的推薦技術和基於物品的推薦技術,它們被稱為協同過濾。

     協同過濾可以利用使用者和物品的資訊來預測使用者的好惡,並發現新的使用者還不知道的東西,形成促銷策略。這就完成了推薦系統的核心思想。

     資料預處理:收集了使用者行為資料,我們還需要對資料進行一定的預處理,減燥和歸一化是最常用的方法,其目的是為了下一步的聚類。

      為了減少計算的開銷,可以先對UI矩陣中的記錄進行聚類,根據聚類的結構在運用SVD演算法。

      KMeans(也稱為K均值)是典型的基於距離的排他的劃分方法:給定一個n個物件的資料集,它可以構建資料的k個劃分,每個劃分就是一個聚類,並且k<=n,同時還要滿足兩個要求:每個組至少包含一個物件,每個物件必須屬於且僅屬於一個組。



    SVD原理和計算:SVD隱語義模型最早在文字挖掘領域被提出,用於找到文字的隱含主題,也被稱為主題模型。相關的名詞有LSI、pLSA、LDA和Topic Model。隱語義模型的核心思想是通過隱含特徵(Latent Factor)計算使用者和物品的相似性。



相關文章