隱語義模型

CopperDong發表於2017-11-08

  自從Netflix Prize比賽舉辦以來,LFM(latent factor model)隱語義模型逐漸成為推薦系統領域耳熟能詳的名詞.其實該演算法最早在文字挖掘領域被提出,用於找到文字的隱含語義.相關的名詞有LSI, pLSA, LDA和Topic Model.本節將對隱含語義模型在Top-N推薦中的應用進行詳細介紹,並通過實際的資料評測該模型.

一,基礎演算法

  它的核心思想是通過隱含特徵(latent factor)聯絡使用者興趣和物品.如豆瓣上圖書推薦

  編輯給出的分類仍然具有以下缺點:

    編輯的意見不能代表各種使用者的意見

    編輯很難控制分類的粒度

    編輯很難給一個物品多個分類

    編輯很難給出多維度的分類

    編輯很難決定一個物品在某一個分類中的權重

  為了解決上面的問題,研究人員提出:為什麼我們不從資料出發,自動地找到那些類,然後進行個性化推薦?於是,隱含語義分析技術(latent variable analysis)出現了.隱含語義分析技術因為採取基於使用者行為統計的自動聚類,較好地解決了上面提出的5個問題.

      

  

相關文章