1、前言****
對於目前單個廣告點選預測,我們能夠得到各元素之間成對的相關性,但無法知道元素之間的區域性相關性。再者,對於不同時間間隔,順序點選預測的現有處理方法沒有一個好的效果,這對此問題,本文提出一個新穎的模型,卷積點選預測模型(CCPM),其基於卷積神經網路。CCPM可以捕獲輸入元素的區域性特徵,無論是在單次點選事件還是在一定時間間隔內順序點選。
2、Introduction
在推薦系統中曾廣泛使用的方法有, matrix factorization (MF),Factorization Machines (FM),然而,MF與FM僅在單個點選廣告中捕獲低階組合特徵,而忽視了高階組合特徵。為了充分利用歷史的順序點選的資訊,提出了基於RNN的預測模型,這個模型主要是把使用者所瀏覽的歷史記錄作為序列,透過使用者在不同的時間間隔內來劃分使用者的歷史點選序列。然而在真實的場景下,使用者對商品的興趣會隨時間而改變,RNN模型在此刻的場景下就受到限制。
在複雜的場景中為了挖掘重要的語義特徵,DNN是一個很好的選擇,CNN中的卷積層,池化層能夠很好的發現區域性重要的特徵。CCPM是第一個採用CNN來提高點選預測的精度的。
3、CCPM
結構圖:
在單條廣告展示中(single ad impression),包括許多元素:element = (user; query; ad, impression time, site category, device type, etc),使用者是否點選一個廣告與使用者的歷史ad impression有關。一系列的ad impression組成sequentia ad impression。基於以上兩種情況來預測點選機率。
CCPM由convolutional layers + flexible p-max pooling layers組成。
3.1、Convolution Layer
每個樣本有n個特徵,對每個特徵使用embeding 得到定長為d的向量ei∈Rd,再構造成一個矩陣s∈Rdxn,得到s矩陣之後就可以套用CNN。
3.2、Flexible p-Max Pooling
由於輸入的長度是可變的,為了降低這種影響,對應的池化層的引數應該也是靈活可變的,給出定義pi:
其中,l代表卷積層的層數,n表示輸入的長度(特徵數),pi表示第i個池化層的引數。舉個例子,當n=18時,l=3,則對應的p的值分別為p1=16,p2=6,p3=3。
在順序點選預測中,p的值很重要,它不僅能夠選擇出最重要的幾個區域性特徵,而且還儲存了這些特徵的相對順序。
3.3、Feature Maps
每個樣本均可用一個矩陣表示,即feature map,然後對每個feature map進行卷積池化操作,最後結果接上全連線層。
本作品採用《CC 協議》,轉載必須註明作者和本文連結