阿里媽媽給出了什麼樣的賽題,被頂會NeurIPS 2024 pick了?

机器之心發表於2024-07-15

會「出價」也是個很實用的技能。

在眾多人工智慧頂會中,NeurIPS 屬於什麼段位?有人將其代入《甄嬛傳》宇宙做了張圖:大概配享「後位」。

圖片

圖源:小紅書使用者 @雲卷月舒

這一排名可能存在爭議,但毋庸置疑的是,NeurIPS 在 AI 頂會中始終穩居前三,並且長期處於 Google Scholar 全球所有學科期刊、頂會的前十名。

圖片

因此,能夠在這一會議中發表論文是眾多 AI 研究者的共同目標。開創性的 AlexNet、Transformer、GPT-3 論文都是該頂會的接收論文。

但值得注意的是,論文並不能代表 NeurIPS 的全部價值,會議期間舉辦的一些競賽可能更適合一些專注於 AI 實踐的研究者、工程師。連 NeurIPS 官方也說,「這些競賽在研究和解決複雜問題方面發揮著重要作用」。

那這些競賽去哪裡找呢?其實,NeurIPS 官方在 6 月份就釋出了一篇部落格,專門給出了這些競賽的列表。

圖片

該列表總共包含 16 個賽題,每個賽題都經過了層層篩選,具有大會要求的「廣泛的科學研究價值」。

圖片

這些賽題由 NeurIPS 官方徵集而來。以往年的經驗來看,能最終入選的賽題絕大部分來自高校、研究機構或者 Google、OpenAI、Meta 等國外科技公司,國內工業界提報的賽題入選機率極低。今年,由於大模型賽道火熱,賽題競爭更為激烈。

但令人驚喜的是,在如此激烈的競爭環境下,國內工業界依然有人脫穎而出,列表中的「Auto-Bidding in Large-Scale Auctions: Learning Decision-Making in Uncertain and Competitive Games(大規模拍賣中的自動出價:不確定和競爭博弈中的學習決策)」便是他們提報的賽題。

圖片

大賽官網:https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

該賽題由北大 - 阿里媽媽人工智慧創新聯合實驗室(PAAI)中的決策智慧方向合作團隊產出,阿里媽媽決策智慧技術團隊作為第一單位同北京大學鄧小鐵教授、盧宗青教授研究團隊聯合提報。在賽題入選後,阿里媽媽拿到了這一比賽的主辦權,成為國內工業界今年唯一一家獲得 NeurIPS 比賽主辦權的組織。

賽題圍繞「大規模拍賣中的自動出價」問題展開。該問題與我們每天開啟購物 APP,搜尋、瀏覽商品的介面息息相關,背後蘊藏著巨大的研究和商業價值。NeurIPS 專家評委給賽題的評價是「Practically important, well organized, and well tested(實際意義重大,組織良好,測試良好)」

那麼,「大規模拍賣中的自動出價」是個什麼問題?為什麼會由北大 - 阿里媽媽人工智慧創新聯合實驗室提出並且獲得瞭如此高的評價?參賽者具體要做什麼?機器之心將在這篇文章中一一拆解。

什麼是「大規模拍賣中的自動出價」?

要理解什麼是「大規模拍賣中的自動出價」,我們先回憶一下開啟淘寶開始購物的經歷。

圖片

每次你輸入一個關鍵詞,系統都會彈出一個商品頁面。其實,這個頁面大有講究:哪些商品會出現,哪個商品排在前面都是系統精密計算的結果,其中的廣告是平臺執行拍賣機制把廣告位分配給廣告主的結果。

整個過程的執行邏輯如下:首先,平臺會透過分析使用者的興趣和行為模式來構建使用者畫像。當使用者在淘寶上進行搜尋或瀏覽商品時,平臺會立即在後臺啟動廣告拍賣流程。廣告主們透過競價機制參與到這場拍賣中,希望能夠讓自己的廣告獲得展示機會。自動出價系統在這個過程中發揮著核心作用,它綜合考慮使用者的畫像、行為資料、廣告主的推廣目標、預算限制,以及拍賣環境中的多種因素,實時計算出最最佳化的出價策略。平臺會根據這些資料和計算結果,選擇出價最高且與使用者需求最相關的廣告。這些廣告結果會和自然結果一起展現給使用者。整個過程完全自動化,能在極短的時間內完成。

從這個過程可以看出,透過自動出價系統,廣告主能夠大大簡化廣告投放的流程,利用人工智慧技術實現精準營銷,從而節省時間和精力。

2023 年,全球線上廣告市場規模已經達到 6268 億美元。自動出價技術對於推動其持續增長至關重要。類似的研究問題還有廣告投放策略和其他機制設計,它們都屬於決策智慧的研究範疇。決策智慧相關研究可以為企業帶來新的運營方式,在決策機制上降低對人的依賴,從而顯著提企高業的收益增長速度,提升企業成長空間。

不過,要做好賽題中的「自動出價」並不容易。因為自動出價系統需應對龐大且複雜的資料洪流,涵蓋使用者行為資料、廣告資料、競價資料等多維度資訊,而且這些資料會實時更新。此外,系統還需在一個充滿不確定性的博弈環境中進行決策,無法獲得所有影響因素的完整資訊。因此,系統只能依賴於當前可用的資料和累積的歷史經驗,透過智慧演算法進行預測和決策,力求在瞬息萬變的市場環境中做出最優的出價選擇。

「自動出價」最佳化之路

強化學習到生成式 AI

總體來看,整個出價領域業界的方法經歷了四代演化。在自動出價策略的最佳化上,阿里媽媽也進行了多年的研究。

  • 第一代:經典控制類。把效果最大化的最佳化問題間接轉化為預算消耗的控制問題。基於業務資料計算消耗曲線,控制預算儘可能按照設定的曲線來消耗。PID 及相關改進是這一階段常用的控制演算法。當競價流量價值分佈穩定的情況下,這類演算法能基本滿足業務上線之初的效果最佳化。

  • 第二代:規劃求解類。相比於第一代,規劃求解類(LP)演算法直接面向目標最大化來進行求解。可基於前一天的參競流量來預測當前未來流量集合,從而求解出價引數。自動出價問題根據當前已投放的資料變成新的子問題,因此可多次持續地用該方法進行求解,即 Online LP。這類方法依賴對未來參競流量的精準預估,因此在實際場景落地時需要在未來流量的質和量的預測上做較多的工作。

  • 第三代:強化學習類。現實環境中線上競價環境是非常複雜且動態變化的,未來的流量集合也是難以精準預測的,要統籌整個預算週期投放才能最大化效果。作為典型的序列決策問題,第三階段用強化學習類方法來最佳化自動出價策略。其迭代過程從早期的經典強化學習方法落地,到進一步基於 Offline RL 方法逼近「線上真實環境的資料分佈」,再到末期貼近問題本質基於 Online RL 方法實現和真實競價環境的互動學習。

  • 第四代:生成模型類。以 ChatGPT 為代表的生成式大模型以洶湧澎湃之勢到來,在多個領域都表現出令人驚豔的效果。新的技術理念和技術正規化可能會給自動出價演算法帶來革命性的升級。阿里媽媽技術團隊提前佈局,以智慧營銷決策大模型 AIGA(AI Generated Action)為核心重塑了廣告智慧營銷的技術體系,並衍生出以 AIGB(AI Generated Bidding)為代表的自動出價策略。

圖片

在業界的最新研究處於第三代時(2022年),北大 - 阿里媽媽人工智慧創新聯合實驗室(PAAI)成立。這個實驗室集齊了產業界和學術界的多位大牛:北京大學智慧學院院長朱松純教授領銜學術指導,北京大學講席教授小鐵、北大智慧學院副教授宋國傑和阿里媽媽技術負責人鄭波都是實驗室的核心成員。幾位大牛帶領實驗室在已有成果的基礎上繼續研究自動出價等決策智慧問題。

在研究過程中,他們發現,原有的強化學習方法存在一些侷限,比如在自動出價這種長序列決策場景下會有訓練誤差累積過多的問題。與此同時,ChatGPT 在多個領域正在驗證生成式 AI 的強大能力。於是,該團隊開始思考,生成式模型能夠給自動出價策略帶來什麼?最終,他們提出了一種基於生成式模型構造的出價策略最佳化方案 ——AIGB(AI Generative Bidding)

具體來說,AIGB 將出價、最佳化目標和約束等具備相關性的指標視為一個聯合機率分佈,從而將出價問題轉化為了條件分佈生成問題。與強化學習的視角不同,它直接關聯決策軌跡和回報資訊(如下圖所示),能夠避免訓練誤差累積,更適合長序列決策場景。這是聯合實驗室率先將生成式大模型應用在智慧出價領域的一次嘗試,相關論文已被國際頂會 KDD 2024 接收

圖片

當然,「大規模拍賣中的自動出價」等決策智慧問題遠未解決,生成式 AI 在這些問題中的應用也才剛剛進入嘗試階段。因此,聯合實驗室就向 NeurIPS 提報了相關賽題,期望藉助多年的研究積累,匯聚社群的力量,共同推動這些問題的深入研究與解決。

除了商業價值,這些問題本身也有很高的研究價值。因為決策智慧整合了人工智慧資料科學博弈論等學科,提供了系統化框架來解決複雜問題。這促進了跨學科融合,推動了電腦科學、統計學和經濟學等領域的創新與合作。

AIGB、通用兩大賽道

報名已開啟

「大規模拍賣中的自動出價」賽題總共分為兩個賽道,分別是:

  • AIGB 賽道:利用生成式模型學習自動出價 Agent

  • 通用賽道:含不確定性的自動出價

在 AIGB 賽道,參賽者需要思考如何針對長序列做精準的出價決策。前面提到,傳統的強化學習方法在面對這一問題時會受到誤差累積等因素的限制,效能表現受限,而廣義的生成模型在這一任務上表現出了較大的潛力。因此,這個本賽道要求參賽者採用廣泛的生成式模型,如 Diffusion Models、Transformers 等,來應對這一挑戰。如果你有 Diffusion Models、Transformers、Foundation Models、大型語言模型(LLMs)及其他生成方法的研究或從業背景,可以考慮報名該賽道。

在通用賽道,參賽選手面臨的挑戰是在大規模拍賣中做出有效的出價決策,這需要有效地感知競爭對手策略的變化。真實世界中複雜的廣告拍賣環境帶來了額外的挑戰,即不確定性。參與者必須考慮消費者到達的隨機性、轉化行為預測的方差、資料稀疏性及其他因素。如果你有強化學習、最佳化、機器學習博弈論資料科學的研究或從業背景,可以考慮報名該賽道。

參加本次比賽將帶來眾多收穫。NeurIPS具有極高的國際影響力,在比賽中取得優異成績,對於你的個人簡歷無疑是個加分項,將非常有助於未來的職業發展。此外,優勝者還有機會贏得6000美元的賽事獎金,以及阿里巴巴的實習機會、校招綠色通道以及訪問學者資格。

本次比賽也將首次公開約5億條博弈資料及相應的訓練框架,如此大規模的博弈資料在業界非常少見。這對於決策智慧、強化學習、博弈和生成式模型等領域的研究者和從業者來說,都是一次很好的實踐和研究機會。

賽程安排和獎項設定如下:

圖片

  • AIGB賽道報名:https://tianchi.aliyun.com/competition/entrance/532236

  • General賽道報名:https://tianchi.aliyun.com/competition/entrance/532226

點選此連結,直達大賽官網。

相關文章