乾貨|個性化推薦系統五大研究熱點之知識圖譜(二)

第四正規化先薦發表於2019-01-08
【編者按】微軟亞洲研究院社會計算組的研究員們從深度學習、知識圖譜、強化學習、使用者畫像、可解釋性推薦等五個方面,展望了未來推薦系統發展的方向。

在上一篇文章中,我們介紹了深度學習技術在推薦系統中的應用以及未來可能的研究方向。在今天的文章中,我們將介紹知識圖譜在推薦系統中的應用,並簡要說明這項應用面臨的機遇與挑戰。

推薦系統與知識圖譜

在多數推薦場景中,物品可能包含豐富的知識資訊,而刻畫這些知識的網路結構即被稱為知識圖譜。物品端的知識圖譜極大地擴充套件了物品的資訊,強化了物品之間的聯絡,為推薦提供了豐富的參考價值,更能為推薦結果帶來額外的多樣性和可解釋性(圖1)。

乾貨|個性化推薦系統五大研究熱點之知識圖譜(二)
                            圖1:利用知識圖譜發掘新聞間的潛在相關性

和社交網路相比,知識圖譜是一種異構網路,因此針對知識圖譜的推薦演算法設計要更復雜和精巧。近年來,網路特徵學習(network representation learning)逐漸成為機器學習中的一個熱門的研究方向。

引入網路特徵學習的方法處理推薦系統中知識圖譜的相關資訊,有助於增強推薦系統的學習能力,提高精確度和使用者滿意度。


將知識圖譜引入推薦系統,主要有如兩種不同的處理方式:

第一,基於特徵的知識圖譜輔助推薦,核心是知識圖譜特徵學習的引入。一般而言,知識圖譜是一個由三元組<頭節點,關係,尾節點> 組成的異構網路。由於知識圖譜天然的高維性和異構性,首先使用知識圖譜特徵學習對其進行處理,從而得到實體和關係的低維稠密向量表示。這些低維的向量表示可以較為自然地與推薦系統進行結合和互動。

在這種處理框架下,推薦系統和知識圖譜特徵學習事實上就成為兩個相關的任務。而依據其訓練次序不同,又有兩種結合形式:

  1. 知識圖譜特徵與推薦系統依次進行學習,即先學習特徵,再將所學特徵用於推薦。
  2. 交替學習法,將知識圖譜特徵學習和推薦系統視為兩個相關的任務,設計一種多工學習框架,交替優化二者的目標函式,利用知識圖譜特徵學習任務輔助推薦系統任務的學習。

第二,基於結構的推薦模型,則更加直接地使用知識圖譜的結構特徵。具體來說,對於知識圖譜中的每一個實體,我們都進行寬度優先搜尋來獲取其在知識圖譜中的多跳關聯實體從中得到推薦結果。根據利用關聯實體的技術的不同,可分向外傳播法向內聚合法兩種方法:

  1. 向外傳播法模擬了使用者的興趣在知識圖譜上的傳播過程。我們近期的工作RippleNet (RippleNet: Propagating User Preferences on the Knowledge Graph for Recommender Systems, CIKM 2018)使用了向外傳播法,將每個使用者的歷史興趣作為知識圖譜上的種子集合,沿著知識圖譜中的連結迭代地向外擴充套件。
  2. 向內聚合法在學習知識圖譜實體特徵的時候聚合了該實體的鄰居特徵表示。通過鄰居聚合的操作,每個實體的特徵的計算都結合了其鄰近結構資訊,且權值是由連結關係和特定的使用者決定的,這同時刻畫了知識圖譜的語義資訊和使用者的個性化興趣。
乾貨|個性化推薦系統五大研究熱點之知識圖譜(二)

結合知識圖譜推薦系統的機遇與挑戰

將推薦演算法與知識圖譜的圖計算方法相結合已逐漸成為學術熱點,前景廣闊。然而現有方法仍有一定侷限,有充分的研究空間。

首先,現有模型都屬於統計學習模型,即挖掘網路中的統計學資訊並以此進行推斷。一個困難但更有研究前景的方向是在網路中進行推理,將圖推理與推薦系統相結合

其二,如何設計出效能優秀且執行效率高的演算法,也是潛在的研究方向。現有模型並不涉及計算引擎層面、系統層面甚至硬體層面的考量,如何將上層演算法和底層架構進行聯合設計和優化,是實際應用中一個亟待研究的問題。

最後,現有的模型網路結構都是靜態的,而在真實場景中,知識圖譜具有一定的時效如何刻畫這種時間演變的網路,並在推薦時充分考慮時序資訊,也值得我們未來研究。


下一篇文章我們將圍繞“推薦系統與強化學習”的研究展開討論。想要了解關於推薦系統的更多研究熱點,還請持續關注。

歡迎大家點贊、收藏,將更多技術知識分享給你身邊的好友。


看了這篇文章的人還看了:

乾貨 | 個性化推薦系統五大研究熱點之深度學習(一)

搭建推薦系統快速入門,只需五步!


相關文章