「DeepFM:A Factorization-Machine based Neural Network for CTR Prediction」- 論文摘要

DeepFM

由FM component和Deep component組成

原始資料 = 種類特徵(eg. gender, location) + 連續特徵(eg. age) + label

綜上：原始資料-> (x, label)
x = [xfield1,xfield2,xfield3,…,xfieldm]

計算公式：

y = sigmoid( yFM+ yDNN)

其中yFM為FM component的輸出，yDNN為DNN component的輸出。y∈{0,1} ，為CTR預測概率。

「DeepFM:A Factorization-Machine based Neural Network for CTR Prediction」- 論文摘要

\hat{y} = sigmoid(y_{FM} + y_{DNN})

FM component包含了加法單元和內積單元。

加法單元：提取一階特徵，直接從原始特徵提取。

內積單元：原始特徵先進行embedding，然後由embedding後的輸出經過內積單元提取二階組合特徵。

最終維度：fieldsize + embedding_size
embedding_size對應的是：

\sum_{i = 1}^{d}\sum_{j=i+1}^{d} \left \langle V_{i},V^{j} \right \rangle x_{i} \cdot x_{j}

FM component總結：

「DeepFM:A Factorization-Machine based Neural Network for CTR Prediction」- 論文摘要

用來提取高階組合特徵。
原始特徵首先經過embedding層降維後，然後經過多個全連線隱藏層輸出，即yDNN

DeepFM：一階特徵(FM)+二階特徵(FM)+高階特徵(DNN)

在DeepFM之前有其他幾個模型：

FNN與PNN的不足之處：
僅能提取高階組合特徵，低階組合特徵無法獲取。

Wide&Deep的不足之處：
在Wide部分還需要進行人工特徵工程。

本作品採用《CC 協議》，轉載必須註明作者和本文連結

文章！！首發於我的部落格Stray_Camel(＾Ｕ＾)ノ~ＹＯ。