【機器學習】--隱語義模型

LHBlog發表於2018-06-12

一、前述

隱語義模型是近年來推薦系統領域較為熱門的話題,它主要是根據隱含特徵將使用者與物品聯絡起來。

因為使用者和物品之間有著隱含的聯絡。所以把使用者轉成隱語義,然後物品轉成隱語義組合,通過中介隱含因子連線。

二、具體

1、隱語義模型舉例和求解

N代表使用者,M代表物體

第一步:先分解 將使用者分解成F個因子的矩陣 將物品也分解成F個因子的矩陣 (F*N)T*(F*M )=N*M 其中T表示轉置。

第二步:轉成機器學習模型:

RUI代表使用者對物品的關係

Pu代表使用者對隱藏因子的關係

QI代表物品對隱藏因子的關係

轉換成機器學習模型,必須先找出損失函式。

損失值=預測值-真實值 其中預測值即分解的RUI ,真實值就是真實的RUI,我們希望找出P矩陣(使用者和隱藏因子的和關係)和Q矩陣(物品和隱藏因子的關係),實際上就是找出對應的引數,所以這些引數就是我們需要求解的模型,我們將這些引數加入到損失函式裡面去,做正則化。

第三步:求解模型

對損失函式求導:

對引數更新迭代:沿著梯度下降的方向,P ,Q就是具體的引數

第四步:建模求解,選擇正負樣本。

正樣本:使用者對物品打分就是正樣本。

負樣本:選取那些很熱門,而使用者卻沒有行為的物品。

對每個使用者,要保證正負樣本的平衡(數目相似)

對於使用者—物品集K {(u,i)},其中如果(u, i)是正樣本,則有 ???= 1,負樣本則???= 0

第五步:引數選擇

F值越大,表示對映維度越多。

隱特徵的個數F,通常F=100

學習速率alpha,別太大
正則化引數lambda,別太大
負樣本/正樣本比例 ratio

第六步:模型使用

根據求得的P和Q,還原回去可得原使用者對物品的評分矩陣,從而進行推薦。

2、協同過濾VS隱語義比較

原理:協同過濾基於統計,隱語義基於建模
空間複雜度,隱語義模型較小
實時推薦依舊難,目前離線計算多
隱語義模型咋解釋呢?不解釋

 

相關文章