圖技術在美團外賣下的場景化應用及探索

美團技術團隊發表於2022-11-24
在外賣廣告CTR預估建模中,我們依託圖技術在場景化上進行了一系列探索。本文首先介紹了使用圖網路技術的出發點,然後從特徵層面的抽象圖關係到子圖擴充套件以及場景感知子圖,逐步介紹如何使用圖技術建模業務問題,並針對聯合訓練的線上服務細節及效果進行解釋和分析,希望能給從事相關工作的同學帶來一些幫助或啟發。

1. 引言

外賣已經成為大眾生活中非常的重要組成部分,大家也逐步感受到外賣帶來的便利。大資料和深度學習時代的到來,使點選率(Click Through Rate, CTR)/轉化率(Conversion Rate, CVR)預估技術得到了長足的發展,深度學習技術已經成為業界的主流方法。美團外賣也透過應用深度模型,線上上取得了顯著的收益。預估模型所做的事情,是建模蘊藏在資料中、在特定場景下使用者和商品之間的關聯性(即“人-貨-場”)。以點選率預估為例,可以對畫像特徵、上下文特徵、行為特徵等進行建模,模型能夠感知在該場景下使用者和商品之間的關聯。

美團外賣是一個場景化業務:使用者當前決策是受不同場景因素共同影響的結果,這些場景因素包括但不限於LBS地理位置、商家營業情況、時間餐段。比如在繁華商圈/小城市(LBS)下的工作日/非工作日/正餐/下午茶(時間餐段),根據商家營業情況圈選商家。相比於傳統電商業務來說,增加了LBS和時段的限制,其場景化因素更為豐富。同時,外賣具有很強的即時需求性質,使用者的決策鏈路會很短,長時間“逛”外賣App的情況較少,故單次使用者決策具備短時性的特點,這也進一步對外賣場景化增加了更多的建模因素。

因此,如何將使用者的外賣需求進行場景化建模,從而提升使用者在使用外賣時的下單體驗,成為外賣預估模型需要重點解決的問題。

1.1 問題與挑戰

相較於傳統電子商務,使用者興趣在外賣業務下呈現出更加明顯的場景化特點,具備【使用者-場景-興趣-決策】鏈路:即使用者在特定場景下,結合自身需求與個人飲食興趣,產生決策。

圖1 場景化使用者行為決策示例

場景化建模在本質上,是在給定場景條件下,比如地理位置、餐段時間、天氣等,基於使用者興趣為使用者匹配出最佳商品。圍繞場景化建模這一目標,業界從不同角度進行了一系列技術探索:

  • 特徵建模:構造使用者-商品-場景互動的統計特徵/交叉特徵,例如:使用者在午餐時段的品類偏好、使用者夜宵時段點選商戶數量統計等。
  • 序列建模:分場景行為序列,精細化刻畫在不同場景下的使用者興趣,例如:使用者在不同蜂窩下的Session行為,在不同時間段的Session行為。

以上建模方法能夠建模場景因素在使用者決策商品時的影響,但存在一些問題:

  • 特徵建模,尤其是特徵交叉的過程中,容易引入噪聲,會對模型學習產生負面影響。
  • 序列建模,依賴於使用者行為的豐富程度,在分場景行為劃分下對低頻使用者的興趣刻畫不友好,同時高頻使用者的興趣刻畫容易陷入個人興趣封閉圈。
  • 交叉和序列正規化對場景的刻畫並不完整,交叉正規化存在維度上限,序列正規化侷限於使用者已有行為偏好。

因此,場景化建模存在以下挑戰:

  • 如何抽取有效場景特徵交叉。
  • 如何打破序列建模下的興趣封閉性。
  • 如何完整地對使用者決策場景進行有效刻畫。

針對上述問題特點,經過逐層分解,我們發現需要一種更加完整、高效的資訊表達方式,能夠具備:關係預測能力、全域性資訊傳播能力、高階表達能力,而我們在圖技術的領域中找到相應的解決方案,後文會針對這些問題和圖技術的解法依次進行展開,希望這些思考和實踐經驗能對大家有所幫助或者啟發。

1.2 圖技術介紹

近些年來,隨著圖神經網路(Graph Neural Networks)的快速發展[1],越來越多的人開始關注起圖資料。工業界也出現了圖技術的相繼落地,很多應用場景都可以抽象為節點向量化表示、分類、聚類、連結預測等圖任務形式。

  • 對於召回場景來說,基於多種實體間天然存在的關聯互動圖,構建深度匹配模型學習到的Embedding表達可以直接用來度量使用者-商品的偏好、商品-商品關聯。
  • 對於預估模型來說,最樸素的視角,即是在使用者-商品這個二部圖上進行連結預測。

在美團內部業務中,Graph Embedding/GNN技術在多個技術團隊落地;如美團平臺[2],[4],[10]相關工作以及外賣技術Represent-Learning專案等,都取得了不錯的正向收益。

相比傳統歐式空間結構型別資料,圖結構資料具有以下特點:

  • 結構化:圖網路具備拓撲結構性,這種結構化特性往往代表了一些規律。例如節點重要性,社群結構等。
  • 關聯化:圖網路提供了一種複雜關係和互動的度量方法。例如關聯關係、依賴關係可以透過圖表徵學習進行度量。
  • 全域性化:圖網路構建採用全域資料,相比私域化的序列資料,圖結構資料更加能夠體現出群體偏好資訊。
  • 強泛化:利用圖網路的訊息傳播機制,圖上節點豐富資訊更容易傳播到冷門節點上,提高冷門節點表達能力。

從業界資訊表示的發展趨勢來看,資訊表示是在升維的:從手工特徵,到序列建模,再到圖建模,背後是對更加完整資訊的有效刻畫的訴求。

  • 手動特徵時代:基於行為日誌統計挖掘使用者/商家/商品畫像。缺點是刻畫粒度較粗、不精準、表達能力有限。
  • Neural Network(NN)序列模型時代:基於原始行為序列設計使用者興趣提取模組端到端學習使用者興趣。優點是一定程度從多峰和動態演變方面提升了使用者興趣表達的準確性。缺點是較難學習到結構化資訊,對於行為資料強依賴,頭部使用者行為密集,中長尾使用者行為稀疏。
  • Graph Neural Network(GNN)時代:萬物皆圖。序列可以看做是一個子圖,相比於序列,圖結構資料對於資訊的表達,更加結構化、完整、豐富。

在日常業務最佳化中我們也發現,如果說要找到一種形式化的建模語言能夠準確、完整的翻譯出我們的業務場景,那麼呈現出來的建模語言就是“圖”。

圖2 資訊表示的發展歷程

因此,我們期待透過圖技術手段,實現外賣場景下的場景建模。以下我們將從圖演算法探索和具體工程實踐落地兩大方面,闡述我們在圖技術場景建模上的嘗試及經驗。

2. 圖技術的場景化探索

外賣場景化是指基於使用者-商家/商品完整互動資訊(< User、POI、Time、Location >)中挖掘到的共性Pattern。我們透過構建使用者-商家/商品互動場景圖來刻畫和提取這個Pattern,並將場景先驗知識引入到預估模型當中輔助決策。業界已經有前沿探索將GNN應用於LBS場景建模,如美團平臺的STGCN[2]從時空結合的角度描述了LBS場景下GNN應用,外賣資料組的“門控超圖GNN”[3]描述了超圖在外賣LBS場景化建模的應用;對比普通GNN方法都取得了SO他的效果。

針對美團外賣的場景化建模特點,我們在圖演算法上也進行了一系列探索,分別在場景特徵交叉、子圖擴充感知、元路徑場景圖三個方面,圍繞著在不同場景下的使用者-POI建模的目標,進行了多方面的探索,在離線評估、線上業務上均取得了不錯的效果。

2.1 基於特徵圖的場景特徵交叉建模

2.1.1 場景特徵交叉

特徵是機器學習模型的源動力,業界常言“特徵的上限決定了模型的上限”。NN時代以前,模型效果的提升有很大一部分來自於特徵工程。隨著模型進入NN時代,NN模型具備的擬合能力以及在資料紅利的加持下,極大地減少了演算法工程師們在特徵工程上的精力開銷,工作重點開始聚焦於模型結構。雖然理論上NN可以擬合一切函式,但在有限的資料和訓練週期內,無法快速地逼近效果上限。在這種背景下,顯式特徵交叉重新得到大家的關注,圍繞自動交叉特徵,業界陸續迭代出FM/xDeepFM/DCN/CAN等模型,並取得了非常好的效果。

在美團外賣場景,也經歷了第一階段的手動交叉特徵,以及第二階段的自動交叉特徵。但在場景化建模中我們發現:交叉特徵帶來了資訊增益,但往往也會帶來“噪聲”問題;比如具體到樣本粒度來說,不同型別的樣本所需要的有效交叉特徵並不是完全一致,存在差異性。近兩年業界的一些工作,如Fi-GNN、L0-SIGN、阿里FIVES等,也都在對應的業務中發現全量資訊交叉引入噪聲問題。

因此,從迭代思路來看,希望能夠引入更多的交叉特徵,同時也減少噪聲資訊的引入,實現在樣本粒度的“個性化”交叉特徵。

2.1.2 圖視角的特徵交叉

特徵交叉,可以抽象為“從全量特徵集中,選擇出K組特徵兩兩組合,實現給模型帶來高效非線性表達能力的目的”。本質上可以看做是特徵-特徵之間二部圖的關係預測:將特徵看作節點,特徵之間的關聯關係看作邊,則可以將所有特徵之間的關聯關係構成一張圖網路。兩個節點連邊的權重,可看作對應特徵之間交叉關係的強弱。透過將此關係圖嵌入到模型訓練過程中,關係圖中不同邊權即反映了不同特徵交叉的重要程度。

每個樣本中N個特徵互相之間構成一個全連通圖記為M,圖中的每個頂點表示特徵F,頂點之間的邊表示任意兩個特徵Fi和Fj的關聯度,記為M<i, j>。透過聯合訓練關係圖和預估模型,更新引數矩陣M,使關係圖的語義資訊與預估模型保持相關性和一致性,主要過程如下圖3所示:

圖3 特徵交叉圖建模過程

主要步驟可描述如下:

  • Step1. 建立引數矩陣(隨機初始化得到),對特徵所對應的向量表示做點積,結果作為關聯絡數。
  • Step2. 對矩陣施加L0懲罰,用於限制矩陣M的引數儘量接近0,減少無用的場景交叉。
  • Step3. 引數矩陣0,1化,用於確定需要參與聚合的節點。
  • Step4. 圖聚合,對於每個特徵來說,與其存在互動的多個特徵進行聚合操作,聚合方式使用Attention。
  • Step5. 將聚合後的特徵向量表示,做為該特徵新的向量表示,用在下游CTR預估的聯合訓練中。

透過特徵交叉係數抽象為圖的邊權重要性評估問題,使模型具備了對場景特徵之間關聯強弱的預測能力,從而能夠更加高效地引入交叉特徵,為使用者的場景化建模提供更多的資訊輸入。

2.2 基於子圖擴充套件的行為圖建模

2.2.1 場景序列建模的痛點和圖解決思路

在外賣演算法模型迭代中,序列建模也經歷了較長時間的迭代,從單場景短期Session建模到多場景使用者長期行為興趣建模,在多個方向上都做出了詳盡的探索。序列建模能夠在使用者歷史行為中,充分發掘使用者的興趣偏好,但是由於使用者行為序列本身是“有偏取樣”的反饋:不同使用者所處的地理位置、商家供給情況、使用頻次等方面存在著較大差異;且高低頻使用者的點選行為分佈差異明顯,呈現出高頻使用者行為豐富聚集、低頻使用者行為稀疏的特點。

對於高頻使用者,可能會導致興趣圈封閉導致模型建模無法跳脫既有的興趣圈;對於低頻使用者,由於資訊的缺乏導致其興趣刻畫不完整。因此,我們需要具備擴充使用者興趣邊界的資訊擴充套件能力、對單點資訊的擴充能力;即尋找一種新的資料結構,打破二維線性限制,實現三維立體擴充套件,基於此種想法,我們從圖的角度來重新思考使用者行為建模:以私域線性行為序列作為興趣刻畫基礎,以公域全域性互聯關係圖作為興趣補充,建立個體差異性與群體共性的連線。

2.2.2 行為POI子圖設計

使用者行為資訊是指使用者在平臺的點選/下單活動記錄,是最原始最直接的對於使用者興趣的刻畫,尤其是針對行為稀疏使用者來說,行為POI序列中任意節點都值得重視。但對於這部分使用者,僅僅依靠個人行為POI很難建模興趣,如果能夠透過圖的方式擴充套件使用者行為,能夠有機會跳脫個人私域行為限制,透過全域性行為圖捕捉不同場景下的潛在興趣。

我們基於使用者Session行為構建了POI網路:在同一個Session裡,使用者所點選過的POI存在關聯,那麼可以將每個Session裡的POI構建一個連通圖;由於不同使用者行為的POI是有重疊的,整個外賣場景下的不同POI簇之間透過這些重疊的POI連結,就可以形成一張POI網路。對於任意一個POI,我們都可以從POI行為網路中,尋找到該POI的一跳、二跳鄰居,這些鄰居可以作為POI資訊的相關補充。這樣,對於使用者的行為興趣刻畫,不僅僅侷限在使用者已有的序列上,而是可以透過子圖進一步擴充套件。

相比傳統序列建模方法,圖網路建模可以利用全域性使用者行為互聯的高階網路結構,藉助POI序列擴充套件使用者興趣:

  • 對於行為稀疏使用者,透過全域性行為互聯圖,補充使用者興趣建模線索。
  • 緩解基於密集使用者行為建模產生的馬太效應,跳出歷史行為探索潛在興趣,提升推薦結果泛化性。

具體的,針對使用者行為序列中的每一個POI,都可以透過子圖進行擴充套件,擴充套件後的子圖透過卷積的方式形成POI的向量表示,如下圖(左)所示。透過行為序列的擴充套件,使使用者行為得到補充,從而得以跳出使用者個人興趣侷限,豐富使用者和POI的資訊表達。

圖4 子圖卷積擴充套件到感知卷積

在POI子圖的基礎上,我們進一步思考如何有效地聚合不同POI,達到子圖資訊更加完整的表達。

  • 建模不同POI之間強弱不同的關聯關係,使用Attention結構動態分配確定POI在所屬子圖中的貢獻度。
  • 考慮到POI子圖是由Session構建的,使用者的行為序列存在差異,相應地POI資訊表達在不同使用者序列中也存在差異,POI子圖資訊應該在不同行為上下文序列中自適應表達。
  • 為了捕捉這種差異性,在子圖卷積的過程中,我們將中心節點與當前行為序列中其他節點做聚合,從而建模行為上下文場景關聯性。

中心節點不僅受到序列和子圖影響,也受到當前候選POI的影響。因此在聯合下游訓練的過程中,我們將中心節點與樣本Target POI進行聚合。

圖5 不同子圖聚合方式示例

離線訓練時,是基於使用者行為序列,對序列中每個POI作興趣子圖擴充;而子圖生成時採用預取樣(Message Passing)+聯合訓練聚合的方式;透過以上三種聚合方式,得到屬於行為序列中POI對應的向量表示。由於這個過程不僅是擴充套件了POI,還將序列資訊、候選POI資訊考慮到了每個節點的表示中,我們稱這種為子圖感知卷積。透過子圖感知卷積,使卷積的過程中,POI的向量表示與上下文資訊產生關聯,從而使POI的嵌入表示融合了更精確的興趣資訊。

2.3 基於元路徑的場景圖建模

2.3.1 從業務特點出發-元路徑建模的初衷

我們對使用者決策過程進行抽象,將使用者User與商戶POI在給定Context環境下的一次互動定義為一個事件(Event),多個使用者和POI互動的結果定義為事件鏈(EventChain)。對於多個強相關的事件鏈(不同事件鏈透過公共節點連線),就構成了一個場景,而場景之間的User、POI主體又存在連線,這樣延展開,實際上就構成了一個“場景”拓撲網路圖,如下圖所示:

圖6 事件與事件鏈抽象示例

可以看到,實際上事件鏈組成的“場景”是一種異構圖:比如具備某些屬性(消費頻率、餐飲偏好等)的使用者U,在某個上下文C下(時間、地點等),點選/購買了具備某些屬性(品類、主營菜品等)的商戶P,這個決策過程實際上是個最簡單的U-C-P元路徑。事件鏈是在這個元路徑的基礎上繼續擴充套件,得到的更長的元路徑例項(U-C1-P2-C2-U')。透過事件鏈,可以建立起場景要素的關係連結,而對場景的完整刻畫,就是對場景要素表示和要素關係的抽取。

至此,我們將場景化建模,抽象為異構圖上元路徑建模問題。接下來,我們將介紹如何在這個場景圖上,實現對使用者決策場景的建模。

2.3.2 到業務中去-元路徑建模的實現

元路徑UCPCU表達的語義為:不同使用者在不同時空場景下,點了同一家商戶,當然不同場景需求可以定義不同的元路徑。為了進一步融合元路徑中豐富的語義表達,僅僅依賴單一的元路徑的話,所表達的語義會受到限制。我們從使用者U出發,透過該元路徑可以擴充套件出一系列的元路徑例項,這些例項刻畫了不同場景下,使用者和POI的跨時空關聯。整個建模過程分為以下幾步:

  • Step1. 使用者和商戶節點存在較多屬性,相比節點拓撲結構包含更多語義資訊。我們將屬性資訊看作節點,透過GraphSAGE的方式聚合到使用者和商戶表示中。
  • Step2. 從使用者U出發,基於元路徑,擴充套件出多條元路徑的例項(事件鏈)。下圖展示多條例項,包括:U-C1-P1, U-C2-P2-C3-U',U-C2-P3-C4-U''-C5-P4;透過擴充套件能夠建立起使用者U和商戶P4的關聯。
  • Step3. 元路徑例項查詢向量表示後進行拼接,並與樣本中的使用者(Target User)進行互動。多條候選元路徑的設計,可以突破單一元路徑依賴資訊裁剪造成的資訊缺失。互動的方式採取Attention,即計算當前使用者與所有候選元路徑的關聯,並最終作用於下游預估中。

圖7 元路徑建模場景化行為示例

對於線上請求,檢索同場景下Emie。

透過圖網路技術,我們擴充套件了不同場景下的使用者潛在興趣,藉助注意力機制捕捉當前決策,與不同元路徑對應場景的關聯性,從而實現場景化建模。

3. 工程實踐落地

3.1 場景圖CTR模型主結構

在模型結構設計的過程中,我們按照”低耦合、高內聚、可插拔、無依賴“的原則,將“行為子圖擴充模組”、“元路徑場景子圖模組”、“特徵圖交叉模組”三個子方向迭代作為獨立模組接入到模型中。

圖8 場景圖CTR模型主結構

3.2 基於子圖擴充套件的行為圖聯合訓練

在“基於子圖擴充套件的行為圖建模”中,對於每個請求線上模組都需要進行“行為序列長度 * 鄰居數”次向量查詢和計算,當行為序列較長時對線上CTR預估服務來說會存在較大的RT挑戰。

考慮POI之間的"全域性行為互聯圖"和使用者的長期興趣較為穩定,因此針對長期行為子圖擴充採用基於行為POI和取樣子圖進行聚合不依賴候選Target POI,短期行為子圖擴充方案仍然採用2.2.2中方案根據序列和候選Target POI動態計算,長短期POI使用不同的Embedding空間。基於此上線方案採取長期行為子圖離線計算+線上查詢的思想,離線計算使用者長期行為序列子圖Embedding並灌庫,線上查詢Redis獲取子圖Embedding參與後續計算。

基於子圖擴充的長期行為模組如下圖所示:

圖9 圖聯合訓練離線線上示例

我們將整個過程分為三步,保證線上耗時不增加的核心在於Step2的子圖拆分重構。因為線上Serving過程中行為子圖Embedding表示不會發生變化,因此使用子圖查詢或聚合後查表,其結果是一致的。

  • Step1. 端到端訓練

在原有CTR模型的基礎上,針對POI行為序列進行子圖查詢擴充套件:每個POI申請從圖引擎中進行鄰域卷積取樣操作,即從二階鄰居聚合到一階鄰居,再聚合到POI本身。

  • Step2. 拆分子圖查詢模組,聚合Embedding,灌庫

訓練完成後,將原有子圖查詢模組拆分,再對長期行為中全量POI做一次子圖POI-Embedding聚合操作,得到行為POI的子圖Embedding。灌庫階段,將長期行為子圖POI的Embedding和其他特徵的Embedding寫入Redis儲存中。

  • Step3. 對聯合訓練的模型進行重構匯出生成新的線上Serving模型

將長期行為“子圖擴充套件的行為圖模組”中子圖聚合計算重構為直接查詢Embedding表徵,線上從Step2灌庫的結果中查取Embedding。

這樣避免線上大量卷積操作的耗時,線上實驗驗證,高峰期TP99與TP999新增模組耗時基本持平。

3.3 場景子圖模組

基於元路徑的場景圖建模是採用元路徑Metapath的方式來表示CTR任務樣本中的使用者子圖和商家子圖,取樣子圖來自預選構建好的User、POI、Context(Context節點包含了蜂窩、餐段資訊)異構行為場景圖。

3.3.1 離線異構圖構建

由於Context會同時連線User與POI,在異構圖上Context節點會成為超級節點(能夠連線一個蜂窩內幾乎全部的User和POI),POI型別節點也可能成為超級節點(連線區域內所有Context節點);當出現了普遍的超級節點後,會導致圖上游走取樣困難、噪聲加劇。我們在設計構建Context節點以及異構邊時防止了這一問題:

  • Step1. Context節點作為時空上下文,貫穿使用者和門店;細化Context節點(比如包含蜂窩、餐段、品類),那麼User與Context的連線邊、Context與POI的連線邊都會大大減少。
  • Step2. 不同User可能透過Context節點跳轉到不同POI上,為了防止取樣時從User節點出發的Path跳轉到不相關的POI上,Context節點最好能夠體現使用者興趣(品類資訊其實就是一種)。
  • Step3. 對於邊權有所限制,能夠避免Context型別節點成為超級節點,POI的問題也會解決。

3.3.2 元路徑取樣建模

使用者興趣、行為相對是分散的,從User節點出發,沿著邊能夠跳轉到不同Context上去,得到相對廣泛的例項,而Metapath取樣得到的例項可以視作是User決策場景表徵集合,具體過程如下:

  • Step1. 以使用者子圖中U-C-P-C-U這樣的路徑為例,取樣出N份例項,按使用者節點擴散的第一個Context分類儲存,如得到M組例項,公式如下。其中Ci是每個分組的例項數,Uuid: <Context1: [Metapath1, Metapath2]; Context2: [Metapath3, Metapath4]; ··· ; ContextM: [Metapath5, Metapath6]>。

  • Step2. 對於一個使用者請求,按Uuid與當前請求Context查詢User子圖,得到能夠匹配當前場景決策資訊的使用者決策場景子圖表達。
  • Step3. 藉助注意力機制捕捉當前決策,計算不同Metapath instance與對應場景的關聯性,從而實現場景化建模。

3.4 效果收益

子圖擴充聯合訓練離線AUC+2千分點;特徵交叉子圖模組離線AUC+1千分點;場景子圖互動離線AUC+2.5千分點。

3.4.1 高低頻場景感知

透過圖建模設計,我們的模型能夠對高低頻場景感知,從而提升場景下對應使用者的效果。

具體地,在外賣展示廣告CTR預估業務中,分析場景化圖演算法在不同頻次的使用者表現情況:統計高頻(過去一個月在美團外賣點選POI次數>150次)和低頻(過去一個月在外賣點選POI次數<15次)使用者,比較實驗組相比對照組(與未採用場景圖的Base模型AB實驗)的線上指標(點選率, CTR/商品交易額(Gross Merchandise Volume, GMV)。同時,我們還按照高低頻使用者分別統計了三級品類的人均曝光數量,對比基線的人均曝光數量。

CTRGMV人均曝光品類數量
低頻使用者+1.58%+1.08%+0.02品類
高頻使用者+2.68%+1.94%+0.3品類

從上表結果可以看出:

  • 低頻和高頻使用者的CTR和GMV均有提升,證明感知子圖卷積能夠有效捕捉高低頻場景,實現場景化下使用者興趣刻畫。
  • 低頻和高頻使用者人均曝光品類數量均有提升,並且高頻使用者的人均品類增加更多,說明具備更好的興趣挖掘探索能力,能夠幫助高頻場景使用者跳脫已有的興趣圈。

3.4.2 特定時空場景感知

為驗證場景圖模型對於不同場景的識別和刻畫能力,進一步對比引入場景圖聯合建模對比無場景圖在時間品類和空間需求下的感知變化(以下多組統計結果均為多天/同時段累計結果)。

3.4.2.1 時間品類場景

奶茶品類是下午時段的熱銷品類,從曝光轉化比來看在下午茶時段較高且時段效應明顯,我們統計了某業務奶茶品類上多天同時段,曝光數量佔該時間段總曝光數量的比例,並比較實驗組相比基線的漲幅情況,從時段上看,實驗組在下午茶時間段(14-16時)奶茶曝光比例上升,而晚間正餐期間曝光比例減少,說明場景圖模型的品類時段感知能力得到加強並且在流量選擇上趨向優質流量,模型上線後在奶茶品類上的整體後驗CTR指標表現正向。

圖10 奶茶品類分時段曝光漲幅對比

3.4.2.2 空間需求場景

外賣上的使用者需求和行為具有明顯的週期效應:即工作日和非工作日,使用者的行為具備較大差異。例如,在非工作日,使用者多數是在家(小區)而不是寫字樓,會有更大的傾向在美團外賣上選購菜品、添置生活用品等(轉化曝光比更高)。

我們以某業務超市便利的品類曝光為例,我們統計了從週一到週日連續7天,超市便利曝光佔當天的總曝光量佔比,按照實驗組和對照組對比曝光佔比情況。從圖中可以看出,實驗組曝光在週一、週二減少,週末上升,說明模型捕捉到了工作日和非工作日下,超市便利的購物場景區別,模型上線後在超時便利品類的整體後驗CTR指標也表現正向。

圖11 超市便利分天曝光對比

4. 總結和展望

與傳統電商推薦不同,外賣推薦呈現出場景化的特點:供給受LBS強約束、使用者決策鏈路短、易受所處環境影響,因此場景化建模是外賣推薦亟需解決的問題。圖網路技術已經在學術界和工業界進行了較為深入的探索,在美團外賣場景化建模中遇到的挑戰,我們也透過圖技術進行了相應的最佳化求解,分別透過場景特徵圖交叉、場景序列子圖擴充套件、元路徑場景圖,在交叉特徵去噪、突破使用者興趣封閉圈、完整場景圖刻畫方面進行了探索。

在演算法落地上,考慮到線上的耗時問題,我們在Serving階段拆分重構長期行為子圖,在不改變模型結果的情況下減少了計算複雜度,滿足了線上的效能要求。圖技術的場景化落地雖然取得了一定的收益,但仍然存在一些問題需要解決,例如特徵圖交叉在算力約束下,只能滿足部分特徵交叉;對於場景的元路徑刻畫仍然依賴於先驗人工定義,尚未走上“自動駕駛”之路,未來我們會持續進行探索。

5. 作者簡介

任建、張偉、雨楓、黃坤、慧楠、鵬業、張波,均來自美團外賣廣告技術團隊。

6. 參考資料

  • [1] Li F, Chen Z, Wang P, et al. Graph intention network for click-through rate prediction in sponsored search[C]//Proceedings of the 42nd international ACM SIGIR conference on research and development in information retrieval. 2019: 961-964.
  • [2] Han H, Zhang M, Hou M, et al. STGCN: a spatial-temporal aware graph learning method for POI recommendation[C]//2020 IEEE International Conference on Data Mining (ICDM). IEEE, 2020: 1052-1057.
  • [3] Yang T, Zhang L, Shi C, et al. Gated Hypergraph Neural Network for Scene-Aware Recommendation[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2022: 199-215.
  • [4] Wu L, Li Z, Zhao H, et al. Learning the implicit semantic representation on graph-structured data[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2021: 3-19.
  • [5] Xie Y, Wang Z, Li Y, et al. Fives: Feature interaction via edge search for large-scale tabular data[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 3795-3805.
  • [6] Chang J, Gao C, Zheng Y, et al. Sequential recommendation with graph neural networks[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 378-387.
  • [7] Shao Z, Xu Y, Wei W, et al. Heterogeneous Graph Neural Network with Multi-view Representation Learning[J]. arXiv preprint arXiv:2108.13650, 2021.
  • [8] Li Z, Cui Z, Wu S, et al. Fi-gnn: Modeling feature interactions via graph neural networks for ctr prediction[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2019: 539-548.
  • [9] Fu X, Zhang J, Meng Z, et al. Magnn: Metapath aggregated graph neural network for heterogeneous graph embedding[C]//Proceedings of The Web Conference 2020. 2020: 2331-2341.
  • [10] Wang Y, Xu H, Yu Y, et al. Ensemble Multi-Relational Graph Neural Networks[J]. arXiv preprint arXiv:2205.12076, 2022.

閱讀美團技術團隊更多技術文章合集

前端 | 演算法 | 後端 | 資料 | 安全 | 運維 | iOS | Android | 測試

| 在公眾號選單欄對話方塊回覆【2021年貨】、【2020年貨】、【2019年貨】、【2018年貨】、【2017年貨】等關鍵詞,可檢視美團技術團隊歷年技術文章合集。

| 本文系美團技術團隊出品,著作權歸屬美團。歡迎出於分享和交流等非商業目的轉載或使用本文內容,敬請註明“內容轉載自美團技術團隊”。本文未經許可,不得進行商業性轉載或者使用。任何商用行為,請傳送郵件至tech@meituan.com申請授權。

相關文章