CIKM 2024 | 美團技術團隊精選論文解讀

美团技术团队發表於2024-11-04
本文精選了美團技術團隊被 CIKM 2024 收錄的 8 篇論文進行解讀,覆蓋了自監督學習、解釋生成、CTR預測、跨域推薦、向量召回、影像生成、時效預測等多個技術領域。這些論文有美團獨立研究,還有跟高校、科研機構合作的成果。希望能給從事相關研究工作的同學帶來一些幫助或啟發。

CIKM是資訊檢索、知識管理和資料庫領域中頂級的國際學術會議,自1992年以來,CIKM成功匯聚上述三個領域的一流研究人員和開發人員,為交流有關資訊與知識管理研究、資料和知識庫的最新發展提供了一個國際論壇。大會的目的在於明確未來知識與資訊系統發展將面臨的挑戰和問題,並透過徵集和評估應用性和理論性強的頂尖研究成果以確定未來的研究方向。2024年,CIKM共收到全球1496篇論文投稿,最終347篇被接收,接收率約為23%。

01 論文標題:Relative Contrastive Learning for Sequential Recommendation with Similarity-based Positive Sample Selection

論文作者:Zhikai Wang(Shanghai Jiao Tong University),Yanyan Shen(Shanghai Jiao Tong University),Zexi Zhang(Shanghai Jiao Tong University),Li He(Meituan),Yichun Li(Meituan),Hao Gu(Meituan)

論文型別:Poster(Full Research Paper track )

論文地址PDF

論文簡介:推薦領域通常面臨嚴重的資料稀疏性問題,對比學習作為一種自監督學習方法,透過提供額外的自監督訊號來增強序列推薦模型的訓練。現有方法通常依賴資料增強策略來建立正樣本並促進表示不變性,但往往一些策略涉及到內容排序和內容替換可能會無意中改變序列中的使用者意圖資訊。基於自監督對比學習的方法透過選擇相同目標序列(與同一目標物品的互動序列)作為正樣本,為基於增強的對比學習方法提供了一種替代方案。然而,基於 SCL 的方法存在相同目標序列稀缺的問題,因而缺乏足夠的對比學習訊號。

本論文提出使用相似序列(具有不同的目標內容)作為額外的正樣本,並引入了一種名為相對對比學習 (RCL) 的新方法用於序列推薦。所提出的 RCL 包含兩級正樣本選擇模組和相對對比學習模組,前者模組選擇相同目標序列作為強正樣本,並使用相似序列作為弱正樣本,後者模組採用加權的相對對比損失,確保每個序列與其強正樣本的表示更接近,而不是弱正樣本。在公開資料集和點評業務資料集上 RCL 都優於現有方法,該演算法在論文接收前已在大眾點評首頁資訊流推薦場景落地並取得顯著的效果。

02 論文標題:Aligning Explanations for Recommendation with Rating and Feature via Maximizing Mutual Information

論文作者: Yurou Zhao(Renmin University of China),Yiding Sun(Renmin University of China),Ruidong Han(Meituan),Fei Jiang(Meituan),Lu Guan(Meituan),Xiang Li(Meituan),Wei Lin(Meituan),Weizhi Ma(Tsinghua University),Jiaxin Mao*(Renmin University of China)

論文型別:Research Track Full Paper

論文下載PDF

論文簡介:為使用者提供基於自然語言的解釋以證明推薦有助於提高使用者滿意度並贏得使用者信任。然而,由於當前的解釋生成方法通常被訓練以模仿現有使用者評論為目標,生成的解釋往往與推薦商品的預測評分或是一些重要特徵不一致,導致這些解釋不能真正地幫助使用者在推薦平臺上做出明智的決策。為了解決這個問題,本文提出了名為MMI(最大化互資訊)的最佳化框架,以增強生成的自然語言解釋與推薦商品的預測評分/重要特徵之間的一致性。

具體來說,本文使用互資訊(Mutual Information, 簡稱MI)作為解釋與預測評分/商品特徵一致性的衡量標準,並訓練一個基於MINE方法的互資訊估計神經網路,將此神經網路作為後續的MI估計器。然後,我們將一個訓練好的解釋生成模型視為主幹模型,基於來自MI估計器的獎勵對其進行基於強化學習的微調。微調過程會指導原先的主幹生成模型學習會生成與商品的預測評分及重要特徵更一致的解釋。在三個公開資料集上的實驗表明,MMI框架可以提升不同的主模型,使它們在與推薦商品的預測評分和重要特徵的一致性方面優於現有的模型。此外,本文透過使用者實驗驗證了MI增強的解釋確實有助於使用者的決策,並且由於它們更好的一致性特點,與其他方法生成解釋相比更能讓使用者滿意。

03 論文標題:Enhancing CTR prediction through Sequential Recommendation Pre-training: Introducing the SRP4CTR framework

論文作者Ruidong Han(Meituan),Qianzhong Li(Meituan),He Jiang(Meituan),Rui Li(Meituan),Yurou Zhao(Meituan),Xiang Li(Meituan),Wei Lin(Meituan)

論文型別:Short Paper

論文下載PDF

論文簡介:理解使用者興趣對於點選率(CTR)預測任務至關重要。在序列推薦中,透過自監督學習從使用者歷史行為中進行預訓練可以更好地理解使用者動態偏好,展現出與CTR任務直接整合的潛力。以往的方法將預訓練模型整合到下游任務中,僅用於提取語義資訊或單獨的使用者興趣編碼,然後將這些資訊作為特徵加入下游模型。然而,這些方法忽略討論了下游任務中的額外推理成本,且沒有考慮如何將預訓練模型中的資訊高效的轉移到CTR任務預測的特定估計項中。

為了解決這一問題,本文提出了增強CTR預測的序列推薦預訓練框架(SRP4CTR)。首先,我們系統的討論了引入預訓練模型對推理成本的影響。隨後,我們引入了一種新的預訓練方法來儘可能保證編碼時資訊的完整性。在微調過程中,本文還引入了一個交叉注意力模組,以較低的成本建立了估計項與預訓練模型之間的橋樑。此外,本文采用了一種新的自查詢技術,以促進從預訓練模型到工業CTR模型間的知識轉移。離線和線上實驗表明,本文的方法優於以前的基線模型。

04 論文標題:EXIT: An EXplicit Interest Transfer Framework for Cross-Domain Recommendation

論文作者:Lei Huang(Meituan),Weitao Li(Meituan),Chenrui Zhang,Jinpeng Wang(Meituan),Xianchun Yi(Meituan),Sheng Chen(Meituan),

論文型別:Applied Research Paper

論文下載PDF

論文簡介:跨域推薦是指利用其他領域的知識增強推薦系統對使用者興趣的預測精度,在工業應用中受到了廣泛關注。現有的隱式建模跨域推薦方法並未考慮不同域之間服務功能和商品展現形式的差異,導致在落地過程中產生嚴重的負遷移問題。例如,使用者在金剛和搜尋中大量表達對醫藥、閃購等緊急需求的興趣,直接將這些訊號用於推薦系統並大量推送醫藥和閃購產品顯然不合適。為解決這一挑戰,本文提出了一種顯式興趣遷移框架,透過顯式建模不同的使用者上下文場景下源域訊號向目標域遷移的機率,實現對目標域興趣訊號的篩選。無需複雜的網路結構及繁瑣的模型訓練過程,本文提出的顯式框架能快速在工業推薦系統落地,為跨域推薦提供了一種簡單而有效的解決方案。該演算法已在美團首頁推薦系統部署上線。

05 論文標題:VIER: Visual Imagination Enhanced Retrieval in Sponsored Search

論文作者:Yadong Zhang(Meituan),Yuqing Song(Meituan),Siyu Lu(Meituan),Qiang Liu(Meituan),Xingxing Wang(Meituan)

論文型別:Short Paper

論文下載PDF

論文簡介:向量召回是搜尋系統的重要能力之一,透過將搜尋詞、使用者和商品的資訊編碼為稠密向量,為使用者檢索出高質量的候選。然而,在即時零售場景下,搜尋詞(Query)存在兩類極端問題:1)短Query通常為模糊意圖,例如鮮花,2)長Query包含大量噪聲實體,例如巧克力鮮花費列羅。這兩類情況導致很難識別使用者確切的搜尋意圖。實際上,消費者對於搜尋的商品有心理影像預期,反映了他們特定的購買意圖,基於此,本文提出了視覺預期增強的多模態檢索模型來建模使用者的潛在視覺偏好。具體來說,透過重建Query共性和使用者個性的影像表徵,並且與語義、使用者行為序列等多模態資訊相融合,增強了對使用者搜尋意圖的理解,從而提升檢索效果。透過搜尋廣告系統中的線上A/B實驗,該方法在相較於基線在收入、點選和點選率等關鍵指標上取得了顯著提升。此外,審稿人評價本文是多模態增強搜尋理解的首批論文之一。

06 論文標題:Design Element Aware Poster Layout Generation

論文作者:Yinan Li(Meituan),Jia Chen(Meituan),Yin Bai(Meituan),Jia Cheng(Meituan),Jun Lei(Meituan)

論文型別:Full Research Paper

論文下載PDF

論文簡介:影像創意在廣告系統中起著重要的作用,利用商戶素材製作優質的圖片創意能夠幫助廣告主吸引更多的使用者、獲得更多的點選。海報佈局生成領域雖然在近期取得了顯著進展,但現有的方法多關注於對海報背景的理解,而忽略了設計元素(例如文字、Logo和底紋)對佈局的影響,這導致生成的佈局經常存在明顯的視覺瑕疵,包括(1)尺寸不當,例如將較短的文字放入較大的文字框中或將長文字放入較小的文字框中,以及(2)影像失真,例如拉伸變形的logo圖示。 為此,本文定義了一個新的佈局生成任務:感知設計元素的海報佈局生成,該任務要求生成的佈局不僅適配於背景圖片,還要與給定的設計元素相匹配。

本文提出了一種名為Design Element aware Transformer (DET)的編碼器-解碼器網路,以生成既適合背景影像,又適配設計元素的合理佈局。其中,編碼器透過可變形自注意力從背景影像及其顯著性圖中提取細粒度的多尺度表示,解碼器接收背景特徵,透過可變形交叉注意力的方式將給定的設計元素內容特徵、期望的寬高位元徵與背景特徵進行關聯,生成最適合各個給定的設計元素佈局位置。同時,本文提出了一種新的評估指標AspDiff,用於衡量生成的佈局與給定設計元素的匹配程度。 在三個公開海報資料集上的定量和定性評估表明,與其他佈局生成方法相比,DET生成的佈局框能更好的適配給定的設計元素,取得更好的視覺效果。該演算法在論文接收前已應用上線,在展示、聯盟等站內外主要廣告場景中落地。

07 論文標題:Process-Informed Deep Learning for Enhanced Order Fulfillment Cycle Time Prediction in On-Demand Grocery Retailing

論文作者:Jiawen Wei(Meituan),Ziwen Ye(Meituan),Chuan Yang(Nankai University),Chen Chen(Meituan),Guangrui Ma(Meituan)

論文型別:Applied Research Paper

論文下載PDF

論文簡介:在即時零售(On-demand Grocery Retail, OGR)領域,準確預測訂單履約週期時間(Order Fulfillment Cycle Time, OFCT)對於提高客戶滿意度和運營效率至關重要。由於自營前置倉+配送的模式,小象這類OGR平臺有著與即時外賣配送(On-demand Food Delivery, OFD)平臺不一樣的運營排程策略和可用資料,面臨著截然不同的時效預測挑戰。本文闡述了兩種領域下時效預測問題的區別,提出了一種基於物理世界OGR訂單履行過程的深度學習模型,用顯式建模的方式刻畫了訂單量、生產能力、配送能力及排程策略等多種因素對OGR履約時效的影響。具體來說,我們使用多個迴圈神經網路(RNN)模組來動態評估生產和配送階段的產能負載,並結合一系列專門的注意力模組來捕捉訂單-訂單之間以及潛在騎手-訂單之間的相互作用對排程系統中訂單履約優先順序的影響。此外,我們的方法還利用深度貝葉斯多目標學習(DBMTL)來識別訂單履約前序階段對後續階段的影響。該方法在小象資料集上已驗證其優越性。我們的研究在OFCT預測方面取得了顯著進展,為尋求最佳化履約流程和提升客戶體驗的OGR平臺提供了深刻洞見。

08 論文標題:《Collaborative Scope: Encountering the Substitution Effect within the Delivery Scope in Online Food Delivery Platform》

論文作者:Yida Zhu(Meituan),Liying Chen(Meituan),Chen Zheng(Meituan),Jia Shi(Meituan),Daping Xiong(Meituan),Zewen Huang(Meituan),Shihao Ren(Meituan),Shuiping Chen(Meituan),Jinghua Hao(Meituan),Renqing He(Meituan)

論文型別:Applied Research Paper

論文下載PDF

論文簡介:商家配送範圍定義了為顧客提供服務的地理區域,決定了使用者所能看到的商家集合。在繪製這些範圍時,構建準確的訂單轉化預估模型和合理刻畫配送難度,是平衡平臺規模與配送體驗及效率的關鍵。目前的方法忽略了使用者在選擇商家時商家之間存在的替代關係這一前提,從單個商家的視角預估轉化率。此外,由於大規模商家組合最佳化求解的複雜性,也增加了多商家聯合決策的難度。

基於此,本論文將問題建模為多商家選品問題,提出了一種基於機器學習+組合最佳化的決策演算法框架,從使用者視角預估不同商家集合下的訂單變化,確保其符合商家間存在替代關係的先驗假設。為了解決求解效率問題,透過在組合最佳化中引入一階泰勒級數近似的方法進行了最佳化。該演算法框架在美團拼好飯業務上已全量,線上結果顯示,在規模不受影響的情況下,透過降低訂單交付距離,顯著提高了交付效率。

| 在美團公眾號選單欄對話方塊回覆【2023年貨】、【2022年貨】、【2021年貨】、【2020年貨】、【2019年貨】、【2018年貨】、【2017年貨】等關鍵詞,可檢視美團技術團隊歷年技術文章合集。

| 本文系美團技術團隊出品,著作權歸屬美團。歡迎出於分享和交流等非商業目的轉載或使用本文內容,敬請註明“內容轉載自美團技術團隊”。本文未經許可,不得進行商業性轉載或者使用。任何商用行為,請傳送郵件至tech@meituan.com申請授權。

相關文章