頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

机器学习blog發表於2019-08-15

原文網址 : http://www.jiqizhixin.com/articles/2019-08-15-3

[1] Deep Interest Network for Click-Through Rate Prediction

Guorui Zhou, Chengru Song, Xiaoqiang Zhu Ying Fan, Han Zhu, Xiao Ma, Yanghui Yan, Junqi Jin, Han Li, Kun Gai

Alibaba Group

KDD 2018

https://arxiv.org/pdf/1706.06978.pdf

點選率預估在工業應用中，例如線上廣告，是一項基本任務。最近，研究人員提出了基於深度學習的模型，這些模型遵循了嵌入+MLP正規化。在這些方法中，大規模稀疏輸入特徵首先對映到低維嵌入向量，然後以分組方式轉換為固定長度的向量，最後將這些特徵串聯在一起，傳入多層感知器 (MLP) 中，進而學習特徵之間的非線性關係。

如此一來，無論候選廣告是什麼，使用者特徵都被壓縮成固定長度的表示向量。在這裡，使用固定長度的向量是一個瓶頸，這給嵌入&MLP方法從豐富的歷史行為中有效地捕捉使用者的多種興趣帶來了困難。本文提出了一種新的模型：深度興趣網路(DIN)，通過一個區域性啟用單元來適應從某一廣告的歷史行為中瞭解使用者興趣的表達，進而解決了上述難題。

該表示向量因廣告不同而不同，這就大大提高了模型的表達能力。此外，作者們還提出了兩種技術：微型批量感知正則化和資料自適應啟用函式，這兩種技巧有助於訓練具有數億個引數的工業界深度網路。

在兩個公共資料集以及包含超過 20 億個樣本的阿里巴巴真實生產資料集上的實驗表明了本文所提方法的有效性，與最先進的方法相比，該方法的效能更優。DIN現已成功部署在阿里巴巴的線上展示廣告系統中，用於服務主要流量。

本文主要貢獻如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

阿里的廣告展示系統圖示如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾類特徵情況統計如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

網路結構圖示如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

控制函式圖示如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

PReLU函式定義如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

Dice定義如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

資料集資訊統計如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

不同正則化方法的效果對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾種方法的效果對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

不同正則方法的auc對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾種方法的效果對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

程式碼地址

https://github.com/zhougr1993/DeepInterestNetwork

[2] Deep Interest Evolution Network for Click-Through Rate Prediction

Guorui Zhou, Na Mou, Ying Fan, Qi Pi, Weijie Bian, Chang Zhou, Xiaoqiang Zhu, Kun Gai

Alibaba Inc

AAAI 2019

https://arxiv.org/pdf/1809.03672.pdf

點選率 (CTR) 預估的目標是估計使用者點選商品的概率，這是廣告系統中的核心任務之一。在CTR預估模型中，需要捕獲使用者行為資料背後的潛在使用者興趣。另外，考慮到外部環境的變化以及內部認知，使用者興趣隨時間的變化而變化。

至今已有多種CTR預測方法用於興趣建模，然而大多數方法將行為表示直接視為興趣，這就無法對具體行為背後的潛在興趣進行建模。此外，這些方法很少考慮興趣的變化趨勢。

本文提出了一種用於CTR預估的新模型，深層興趣演化網路，DIEN。具體來說，作者們提出了興趣提取層，用於從歷史行為序列中捕獲隨時間變化的興趣。在此層中，通過引入輔助損失函式用於監督每步提取的興趣。

由於使用者興趣多種多樣，特別是在電子商務系統中，作者們利用興趣演化層來捕捉相對於目標專案的興趣演變過程。在興趣演化層中，將注意力機制嵌入序列結構中，如此一來在興趣演化過程中強化了相對興趣的影響。

在公共資料集和工業資料集的實驗中，DIEN 的效果顯著優於最先進的解決方案。值得注意的是，DIEN已部署在淘寶的廣告展示系統中，CTR提高了20.7%。

本文主要貢獻如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

本文網路結構圖示如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

資料集資訊統計如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾種模型在兩個公開資料集上的auc對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾種模型在工業資料集上的auc對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

AUGRU及輔助損失的效果如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

其中AUGRU為GRU with attentional update gate

不同損失函式的學習曲線對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

不同模型的AB測試結果如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

程式碼地址

https://github.com/mouna99/dien

[3] Deep Session Interest Network for Click-Through Rate Prediction

Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang

Alibaba Group, Zhejiang University

IJCAI 2019

https://arxiv.org/pdf/1905.06482.pdf

點選率 (CTR) 預估在許多工業應用中扮演著重要的角色，其中包含線上廣告和推薦系統等。

如何從使用者行為序列中獲取使用者的動態和不斷變化的興趣，在CTR預估中是一個持續的研究課題。然而，目前大多數研究人員都忽視了序列的內在結構，即序列是由會話組成的，而會話由發生時間分隔的使用者行為構成。

作者們觀察到，使用者行為在每個會話中都是高度同質的，並且不同的會話中使用者行為是異構的。基於此，作者們提出一種新CTR 模型，深度會話興趣網路 (DSIN)，該模型利用使用者的行為序列中的多個歷史會話。

該模型首先使用帶有偏置編碼的自我注意機制來提取使用者在每個會話中的興趣。然後，利用Bi-LSTM 對使用者的興趣如何演變和會話之間的互動進行建模。最後，利用區域性啟用單元自適應地學習各種會話興趣對目標項的影響。

在廣告和生產推薦資料集上的實驗表明，DSIN 優於其他最先進的模型。

幾個會話的示例如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

本文的主要貢獻如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

本文網路結構如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

幾種方法在廣告和推薦資料集上的AUC對比如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

自注意力機制圖示如下

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

程式碼地址

https://github.com/shenweichen/DSIN

頂會中深度學習用於CTR預估的論文及程式碼集錦 (1)
2019-08-05
深度學習
深度學習用於文字摘要的論文及程式碼集錦
2019-08-09
深度學習
從FM推演各深度CTR預估模型(附程式碼)
2018-07-16
模型
從2019 AI頂會最佳論文，看深度學習的理論基礎
2020-01-27
AI深度學習
【深度學習論文篇 03-2】Pytorch搭建SSD模型踩坑集錦
2022-05-02
深度學習PyTorch模型
資深演算法專家解讀CTR預估業務中的深度學習模型
2018-07-12
演算法深度學習模型
基於TensorFlow Serving的深度學習線上預估
2018-10-18
深度學習
20篇頂級深度學習論文（附連結）
2018-05-24
深度學習
（讀論文）推薦系統之ctr預估-DeepFM模型解析
2019-07-25
模型
深度學習論文和開原始碼
2020-04-06
深度學習原始碼
從FM推演各深度CTR預估模型（附開原始碼）
2018-07-21
模型原始碼
PaddlePaddle分散式訓練及CTR預估模型應用
2019-05-21
分散式模型
超全！CS 頂會歷屆最佳論文大列表，機器學習、深度學習一應俱全！
2019-10-08
機器學習深度學習
CTR學習筆記&程式碼實現5-深度ctr模型 DeepCrossing -> DCN
2020-05-15
筆記模型ROS
深度學習相關論文
2020-04-06
深度學習
CTR學習筆記&程式碼實現6-深度ctr模型後浪 xDeepFM/FiBiNET
2020-06-01
筆記模型
【論文寫作】錯誤集錦
2020-11-02
Nature論文解讀 | 基於深度學習和心臟影像預測生存概率
2019-02-26
深度學習
《深度學習案例精粹：基於TensorFlow與Keras》案例集用於深度學習訓練
2022-02-15
深度學習Keras
10K+，深度學習論文、程式碼最全彙總！一鍵收藏
2019-03-18
深度學習
深度學習-最新論文解釋
2019-04-10
深度學習
深度學習論文翻譯解析（十九）：Searching for MobileNetV3
2021-02-05
深度學習
深度學習“見頂”不等於AI寒冬
2019-01-25
深度學習AI
深度學習在美團配送ETA預估中的探索與實踐
2019-02-22
深度學習
深度學習及深度強化學習應用
2021-01-04
深度學習強化學習
【深度學習論文篇 01-1 】AlexNet論文翻譯
2022-04-05
深度學習
CTR預估專欄 | 一文搞懂阿里Deep Interest Network
2019-03-04
阿里REST
三層登陸程式碼及錯誤集錦
2018-07-02
2018年學術頂會：深度學習的江山如此多嬌
2019-01-01
深度學習
AAAI 2021論文：利用深度元學習對城市銷量進行預測（附論文下載）
2020-12-31
AI
深度學習論文閱讀路線圖
2018-08-06
深度學習
《基於深度學習的目標檢測綜述》論文獲發表
2023-01-30
深度學習
論文分享：用於模型解釋的對抗不忠學習
2020-11-25
模型
0基礎讀頂會論文—Kappa：一種用於無伺服器計算的程式設計框架
2024-11-05
APP伺服器程式設計框架
查詢CV頂會ICCV,CVPR,ECCV論文方法以及sota實現程式碼
2019-11-14
Python專案開發案例集錦及配套程式碼
2019-11-27
Python
【深度學習論文篇 02-1 】YOLOv1論文精讀
2022-04-14
深度學習YOLOv1
AI 頂會灌水嚴重，論文疲於趕場，科學研究變味了？
2020-03-29
AI

頂會中深度學習用於CTR預估的論文及程式碼集錦 (3)

[2] Deep Interest Evolution Network for Click-Through Rate Prediction

[3] Deep Session Interest Network for Click-Through Rate Prediction

相關文章