SamWalker: Social Recommendation with Informative Sampling Strategy
Authors: Jiawei Chen, Can Wang, Sheng Zhou, Qihao Shi, Yan Feng, Chun Chen
WWW'19 浙江大學
論文連結:https://zhoushengisnoob.github.io/papers/SamWalker.pdf
0. 總結
這篇文章提出了一個利用社交網路資訊的推薦模型SamWalker。SamWalker可以建模使用者和物品之間的曝光概率,並提出用社交網路隨機遊走進行負取樣的方式來替代曝光概率的計算,降低模型計算複雜度。此外,模型還可以利用等效的卷積神經網路來優化社交連線強度。在三個資料集上,SamWalker都取得了超過所有baseline的效能,並結合Ablation study等實驗證明了模型的效能。
1. 研究目標
利用社交資訊建模曝光概率,提高推薦準確率和模型穩定性。
2. 問題背景
在隱式反饋資料中,一個使用者沒有與一個物品發生互動,可能是因為使用者對物品沒有興趣,也可能是因為使用者沒有看到這個物品。因此,將所有未觀測到的互動都作為負樣本進行取樣,會損害推薦系統的效能,這也被稱為推薦系統中的exposure bias。現有的方法通過對未觀測資料進行降權來緩解exposure bias,但這些方法存在兩個問題:(1)權重通常是人工賦予的,缺乏靈活性和準確性。(2)資料中包含的資訊很少,難以準確預測曝光概率。
3. 方法
為了解決上述問題,本文提出了SamWalker,利用社交資訊來推斷曝光概率,並指導取樣過程。
使用者會從朋友/關注的人那裡獲得有關物品的資訊(例如朋友之間的推薦),因此,使用者的社交資訊會影響物品對使用者的曝光概率。一個物品在使用者的社交網路中越流行,使用者看到這個物品的概率就越高。
由於社交網路很複雜,基於社交網路計算所有user-item對的曝光概率複雜度很高。本文采用在社交網路上隨機遊走的方式指導負取樣。
3.1 問題定義
假設我們有使用者集U,包含n個使用者;物品集I,包含m個物品;隱式反饋互動記錄X,矩陣維度為\(n*m\),其中每個元素\(x_{ij}\)表示使用者i與物品j是否發生了互動(1或0);社交資訊矩陣T,矩陣維度為\(n*n\),其中每行元素\(\tau_i\)表示使用者i的社交連結,\(\tau_{ij}\)表示使用者i與使用者j是否有社交聯絡。
3.2 EXMF分析
EXMF是2016年提出的建模曝光概率的推薦模型,具體請參考博文【論文筆記】Modeling User Exposure in Recommendation。
(3.3變分分析這部分我還沒看明白,等後面懂了再來寫詳細過程orz)
EXMF的缺點
- EXMF建模曝光概率的引數過多(m*n),工業場景下不可實現;且大部分曝光概率都很小,對模型優化貢獻很小。
- EXMF認為曝光概率與使用者的特徵無關,但實際上使用者的社交網路對曝光概率也有著極大的影響。
3.3 SamWalker 概述
為了降低引數量,使用一個傳播模型來建模社交資訊對曝光概率的影響,從第t步到第t+1步的曝光概率傳播方式如下:
其中i表示使用者i,j表示物品j,\(\gamma_{i j}^{(t+1)}\)表示第t+1步的曝光概率,\(x_{ij}\)表示訓練集的標籤(0或1,表示是否互動),\(\varphi_{i k}\)表示使用者i和使用者k之間的連線強度,滿足\(\sum_{k\in\tau_i}\varphi_{ik} = 1\),c是調節社交資訊權重的引數。
總的來說,曝光概率收斂公式為:
\(Y^{(t)}_{ij}\) = \(\gamma_{i j}^{(t)}\),是第t步的曝光概率矩陣;\(\phi_{ij} = \varphi_{ij}\),是社交連線強度矩陣 。
3.4 基於隨機遊走的個性化負取樣方法
作者證明了當取樣概率\(p_{ij}\)正比於曝光概率\(\gamma_{i j}^{(t)}\)時,取樣方差更小,且梯度估計更快(就是用負取樣階段的設計來替代loss函式中的曝光概率計算)。
那怎樣能夠做到正比於曝光概率\(\gamma_{i j}^{(t)}\)的負取樣呢?
一個直觀的想法就是計算出所有的曝光概率,再進行負取樣,但這樣計算複雜度太高。
曝光概率的計算迭代公式可以展開為:
基於上式,對於user i,我們給出如下隨機遊走規則進行負取樣,使得負取樣概率正比於推匯出的曝光概率:
-
在第t步隨機遊走時,假設我們遊走到了user u。
-
我們有兩種選擇:
- (1)這一步不進行遊走,隨機選擇u的一定比例(\(\beta\))的鄰居物品i作為負樣本。概率為c。
- (2)根據社交連線強度\(\varphi_{uv}\)進行隨機遊走,遊走至使用者節點v,並隨機選擇v的一定比例(\(\beta\))的鄰居物品i作為負樣本。概率為(1-c)。
-
直至遊走\(\alpha\)步,隨機遊走結束,負取樣結束。
-
在每次隨機遊走過程中,如果遊走到距離很遠的user,社交資訊就變得很少了。具體來說,如果當前節點與初始節點i的距離\(t>t_m\),則直接在所有user中隨機選擇,進行遊走。
3.5 社交連線強度\(\varphi\)的優化
由於不同的社交連線對使用者的影響是不同的,例如由於朋友之間聯絡的密切程度不同,朋友之間的推薦頻率和推薦強度也不同。而曝光概率\(\gamma_{i j}^{(t)}\)的推導是基於社交連線強度矩陣的,而這個矩陣需要我們進行優化。
為了優化連線強度,設計一個卷積神經網路來計算曝光概率,網路中的權重就是user之間的連線強度。這樣可以在優化推薦loss的時候回傳梯度,達到優化連線強度的目的。
3.6 方法討論
由於使用者不僅會受到直接好友的影響,還會受到大眾輿論的影響。因此,可以在模型中加入一個節點,代表所有使用者對一個使用者行為的影響。隨機遊走的設計也需要做出響應改變,即增加一個直接在所有使用者中隨機選擇節點的概率。
4. 實驗
4.1 資料集
實驗採用了Epinions、Ciao和LastFM三個資料集。其中Epinions和Ciao是從產品評論網站抓取的資訊,含有使用者之間的“信任”資訊;LastFM是從音樂網站爬取的,含有使用者之間的好友資料。
4.2 推薦效能
實驗結果表明,在三個資料集上,SamWalker都優於所有baseline。
4.3 取樣器效能
實驗結果表明,SamWalker設計的社交網路隨機遊走取樣器可以降低梯度的方差,獲得更穩定的模型。
4.4 Ablation study
實驗表明,學習個性化的連線強度、引入社交資訊和全域性社交資訊都有助於提升模型效能。圖中SamWalker-ho表示所有社交連線強度都是一樣的;SamWalker-l表示只考慮社交資訊,不考慮全域性user;SamWalker-g表示只考慮全域性user,不考慮社交資訊。
4.5 \(t_m\)對模型效能的影響
\(t_m\)表示隨機遊走的最大長度,當隨機遊走超過此長度時,會在所有使用者中隨機選擇節點進行遊走。
隨著\(t_m\)的增加,效能呈現先上升後下降的特點。在\(t_m\)比較小的時候,增加\(t_m\)可以提供更廣的社交資訊。但隨著\(t_m\)的進一步增大,帶來的有用社交資訊開始減少,噪聲開始增多,模型效能會開始出現下降。實際上,在社交網路中,從一個節點出發,6跳就可以基本覆蓋所有人,因此過長的隨機遊走效果不好。
5. 不懂的問題
變分法
6. 進一步閱讀
[5] Rocío Cañamares and Pablo Castells. 2018. Should i follow the crowd?: A probabilistic analysis of the effectiveness of popularity in recommender systems. In The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. ACM, 415–424
[6]Pablo Castells, Neil J Hurley, and Saul Vargas. 2015. Novelty and diversity in recommender systems. In Recommender Systems Handbook. Springer, 881–918.
[12]Jingtao Ding, Fuli Feng, Xiangnan He, Guanghui Yu, Yong Li, and Depeng Jin. 2018. An improved sampler for bayesian personalized ranking by leveraging view data. In Companion of the The Web Conference 2018 on The Web Conference 2018. International World Wide Web Conferences Steering Committee, 13–14.
[17]Xiangnan He, Lizi Liao, Hanwang Zhang, Liqiang Nie, Xia Hu, and Tat-Seng Chua. 2017. Neural collaborative filtering. In Proceedings of the 26th International Conference on World Wide Web. International World Wide Web Conferences Steering Committee, 173–182.
[18]Xiangnan He, Hanwang Zhang, Min-Yen Kan, and Tat-Seng Chua. 2016. Fast matrix factorization for online recommendation with implicit feedback. In Proceedings of the 39th International ACM SIGIR conference on Research and Development in Information Retrieval. ACM, 549–558.
[26]Chen Jiawei, Feng Yan, Ester Martin, Zhou Sheng, Chen Chun, and Can Wang. 2018. Modeling Users’ Exposure with Social Knowledge Influence and Consumption Influence for Recommendation. In Proceedings of the 27th ACM International on Conference on Information and Knowledge Management. ACM, 953–962