使用圖神經網路做基於會話的推薦

dicksonjyl560101發表於2019-05-21

原文網址 : http://blog.itpub.net/29829936/viewspace-2645017/

神經網路會話

https://www.toutiao.com/a6692923714587066893/

2019-05-20 10:02:16

1、背景介紹

現有基於會話的推薦，方法主要集中於迴圈神經網路和馬爾可夫鏈，論文提出了現有方法的兩個缺陷：

1）當一個會話中使用者的行為數量十分有限時，這些方法難以獲取準確的使用者行為表示。如當使用RNN模型時，使用者行為的表示即最後一個單元的輸出，作者認為只有這樣並非十分準確。

2）根據先前的工作發現，物品之間的轉移模式在會話推薦中是十分重要的特徵，但RNN和馬爾可夫過程只對相鄰的兩個物品的單向轉移關係進行建模，而忽略了會話中其他的物品。

針對上面的問題，作者提出使用圖網路來做基於會話的推薦，其整個模型的框架如下圖所示：

接下來，我們就來介紹一下這個流程吧。

2、模型介紹

2.1 符號定義

V={v1,v2,...,vm} 代表所有的物品。s=[vs,1,vs,2,...,vs,n]代表一個session中按照時間先後排序的使用者點選序列，我們的目標是預測使用者下一個要點選的物品vs,n+1

2.2 子圖構建

我們為每一個Session構建一個子圖，並獲得它對應的出度和入度矩陣。

假設一個點選序列是v1->v2->v4->v3，那麼它得到的子圖如下圖中紅色部分所示：

再假設一個點選序列是v1->v2->v3->v2->v4，那麼它得到的子圖如下：

同時，我們會為每一個子圖構建一個出度和入度矩陣，並對出度和入度矩陣的每一行進行歸一化，如我們序列v1->v2->v3->v2->v4對應的矩陣如下：

上圖中，左邊的矩陣是出度矩陣，右邊的矩陣是入度矩陣，如果同時考慮出度和入度，模型學習的就不是簡單的單向轉移關係了，而是更加豐富的雙向關係。

2.3 基於Graph學習物品嵌入向量

基於Graph學習物品的嵌入向量，作者借鑑的下面這篇文章《GATED GRAPH SEQUENCE NEURAL NETWORKS》（地址：https://arxiv.org/pdf/1511.05493v3.pdf）的做法，其實就是一個GRU單元，不過在輸入時，模型做了一定的改進。

模型的輸入計算公式如下：

我們還是使用剛才的序列v1->v2->v3->v2->v4來一點點分析輸入的過程。

1）ats,i是t時刻，會話s中第i個點選對應的輸入

2）As,i:代表的是一個分塊矩陣，它是1*2n的，n代表序列中不同物品的數量，而非序列的長度，此處是4，而非5。舉例來說，假設我們當前的i=2，那麼其對應的As,2:=[0,0,1/2,1/2 | 1/2,0,1/2,0]。我們可以把As,i:拆解為[As,i:,in,As,i:,out]

3）vt-1i可以理解為序列中第i個物品，在訓練過程中對應的嵌入向量，這個向量隨著模型的訓練不斷變化，可以理解為隱藏層的狀態，是一個d維向量。

4）H是d*2d的權重向量，也可以看作是一個分塊的矩陣，可以理解為H=[Hin|Hout]，每一塊都是d*d的向量。

那麼我們來看看計算過程：

1）[vt-11,...,vt-1n] ，結果是d * n的矩陣，轉置之後是n*d的矩陣，計作vt-1

2）As,i:vt-1H相當於[As,i:,invt-1Hin , As,i:,outvt-1Hout]，即拆開之後相乘再拼接，因此結果是一個1 * 2d的向量。

上面的過程，相當於分別對一個節點的出度和入度進行處理，再進行合併。該過程是我通過程式碼慢慢理解的，程式碼如下：


fin_state = tf.reshape(fin_state, [self.batch_size, -1, self.out_size])


fin_state_in = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),


 self.W_in) + self.b_in, [self.batch_size, -1, self.out_size])


fin_state_out = tf.reshape(tf.matmul(tf.reshape(fin_state, [-1, self.out_size]),


 self.W_out) + self.b_out, [self.batch_size, -1, self.out_size])


av = tf.concat([tf.matmul(self.adj_in, fin_state_in),


 tf.matmul(self.adj_out, fin_state_out)], axis=-1)

上面的程式碼中，fin_state相當於儲存的是我們的vt-1，self.W_in相當於我們的Hin， self.W_out相當於我們的Hout，self.adj_in相當於As,i:,in，self.adj_out相當於As,i:,out。

有一丟丟的複雜，上面是我個人的理解的計算過程，大家可以作為參考。

上面的輸入，我們充分考慮了圖的資訊，接下來，就是GRU單元了，這裡的GRU單元沒有太多變化，公式如下：