清華大學和京東發表於KDD 2019的全新強化學習框架FeedRec

AMiner學術頭條發表於2019-05-20

原文網址 : http://www.jiqizhixin.com/articles/2019-05-20-7

KDD 2019 包括兩個 track：Research track 和 Applied Data Science track。

今年的 KDD Research track 共評審約 1200 篇投稿，其中約 110 篇 oral 論文，60 篇 poster 論文，接收率約 14%，比往年的 17%~18% 還要下降了近 4 個百分點。此前 3 年 KDD Research track 的錄用情況分別是：投稿 983 篇，收錄 178 篇（2018）；投稿748 篇，收錄 130 篇（2017）；投稿 784篇，收錄142 篇（2016）。

而此次 ADS track 約投稿 700 篇，其中 45 篇 oral 論文，100 篇 poster 論文。

學術君今天為大家推薦的是清華大學和京東發表於KDD 2019的工作。

論文題目
Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems
作者
Lixin Zou, Long Xia, Zhuoye Ding, Jiaxing Song, Weidong Liu, Dawei Yin
會議/年份
KDD 2019
連結
http://export.arxiv.org/abs/1902.05570
Abstract
Recommender systems play a crucial role in our daily lives. Feed streaming mechanism has been widely used in the recommender system, especially on the mobile Apps. The feed streaming setting provides users the interactive manner of recommendation in never-ending feeds. In such an interactive manner, a good recommender system should pay more attention to user stickiness, which is far beyond classical instant metrics, and typically measured by {\bf long-term user engagement}. Directly optimizing the long-term user engagement is a non-trivial problem, as the learning target is usually not available for conventional supervised learning methods. Though reinforcement learning~(RL) naturally fits the problem of maximizing the long term rewards, applying RL to optimize long-term user engagement is still facing challenges: user behaviors are versatile and difficult to model, which typically consists of both instant feedback~(\eg clicks, ordering) and delayed feedback~(\eg dwell time, revisit); in addition, performing effective off-policy learning is still immature, especially when combining bootstrapping and function approximation.
To address these issues, in this work, we introduce a reinforcement learning framework --- FeedRec to optimize the long-term user engagement. FeedRec includes two components: 1)~a Q-Network which designed in hierarchical LSTM takes charge of modeling complex user behaviors, and 2)~an S-Network, which simulates the environment, assists the Q-Network and voids the instability of convergence in policy learning. Extensive experiments on synthetic data and a real-world large scale data show that FeedRec effectively optimizes the long-term user engagement and outperforms state-of-the-arts.
推薦理由
本文是清華大學和京東發表於 KDD 2019 的工作。論文針對利用強化學習解決推薦系統時存在使用者行為難以建模的問題，提出了一種新的強化學習框架 FeedRec，包括兩個網路：Q 網路利用層次化 LSTM 對複雜使用者行為建模，S 網路用來模擬環境，輔助和穩定 Q 網路的訓練。方法在合成資料和真實資料上進行了驗證，取得了 SOTA 的結果。

清華大學和京東發表於KDD 2019的全新強化學習框架FeedRec

清華大學和京東發表於KDD 2019的全新強化學習框架FeedRec 傳送門：

論文地址：

http://export.arxiv.org/pdf/1902.05570

苗大東：京東基於強化學習的電商搜尋排序演算法
2022-05-17
強化學習排序演算法
強化學習(十七) 基於模型的強化學習與Dyna演算法框架
2019-02-15
強化學習模型演算法框架
【強化學習】強化學習術語表（A-Z）
2020-10-25
強化學習
清華大學崔鵬：探索因果推理和機器學習的共同基礎
2020-12-10
機器學習
AAAI 2019 | 基於分層強化學習的關係抽取
2019-03-28
AI強化學習
關於強化學習、深度學習deeplearning研修
2020-11-25
強化學習深度學習
homebrew 使用清華大學映象
2019-10-29
Google開源TensorFlow強化學習框架！
2018-08-28
Go強化學習框架
強化學習的框架化，會引爆AI開發的新腦洞嗎？
2019-01-28
強化學習框架AI
劍橋大學等開源RLgraph框架，讓強化學習測試視覺化
2019-04-11
框架強化學習視覺化
清華大學王奕森：對抗機器學習的攻防技術
2019-07-01
機器學習
京東城市6篇論文被KDD2019收錄，展示AI和大資料在智慧城市的落地應用
2019-08-05
AI大資料
《強化學習》一書術語表
2018-07-14
強化學習
NeurIPS 2018值得一讀的強化學習論文清單
2018-12-13
強化學習
清華大學：2019中國消費信貸市場研究
2020-08-20
2019年十大最佳深度學習框架
2019-06-21
深度學習框架
強化學習-學習筆記13 | 多智慧體強化學習
2022-07-10
強化學習筆記智慧體
強化學習
2020-12-05
強化學習
機器學習、深度學習、強化學習課程超級大列表！
2019-11-06
機器學習深度學習強化學習
突破！自然語言強化學習(NLRL)：一個可處理語言反饋的強化學習框架
2024-12-07
強化學習框架
阿里、百度、騰訊、滴滴、華為、京東、聯想 KDD2020公司論文大盤點
2020-07-27
阿里
DeepMind用元強化學習框架探索多巴胺在學習過程中的作用
2019-02-21
強化學習框架
基於策略搜尋的強化學習方法
2020-10-02
強化學習
【強化學習篇】--強化學習案例詳解一
2018-06-30
強化學習
深度強化學習day01初探強化學習
2019-06-27
強化學習
強化學習10——迭代學習
2020-10-26
強化學習
日本東京大學：研究發現貓能聽懂自己名字
2019-04-28
基於Cucumber框架的學習
2024-08-23
框架
清華大學大資料研究中心成立
2018-10-12
大資料
【譯】2019年值得學習的頂尖JavaScript框架和要學習的主題
2019-01-29
JavaScript框架
KDD 2019 | JOIE：聯合知識圖譜例項和本體概念的通用表示學習
2019-08-12
經濟學原理（曼昆）清華大學課程學習筆記（一）：微觀經濟學
2020-06-27
筆記
Hadoop大資料開發框架學習
2018-08-31
Hadoop大資料框架
【強化學習】強化學習的基本概念與程式碼實現
2018-03-21
強化學習
強化學習-學習筆記3 | 策略學習
2022-07-05
強化學習筆記
清華大學：2019年智慧養老產業白皮書（附下載）
2020-06-30
產業
清華大學&中國人工智慧學會：2019人工智慧發展報告（附下載）
2019-12-02
人工智慧
關於強化學習需要了解的知識
2019-03-06
強化學習

清華大學和京東發表於KDD 2019的全新強化學習框架FeedRec

相關文章