
在保衛變革性的技術交替之際,回顧搜搜推廣模型的歷史演進,抓住三條關鍵路線(明線、暗線和輔助線)有助於更加清晰地理解技術升級的內在邏輯。同時,明確如何在新時期系統性發揮算力優勢,深度挖掘搜搜推廣領域的尺度規律,已成為推動技術進步的核心路線。 新探索的前哨站,訴狀模型透過與大模型的深度結合,全面提升感知與推理能力。在感知方面,著眼於解決系統內容融合資訊與行為良好資訊的問題,持續最佳化多模態表徵的質量,突破傳統ID表徵的前置,逐步實現對感知世界更豐富的感知建模;在推理層面,構建使用者序列大模型,將生成式方法與判別行為方法有機結合,探索推理能力的持續進化之路。 大模型正在全面全面搜尋廣告系統。依託預訓練(pre-train)與後(post-train)的模型迭代新正規化,阿里媽媽自主研發了廣告領域專屬大模型LMA(Large Models for Advertising),並於2024年4月業務隨宣推。LMA是電商基礎大模型衍生出來的廣告模型集合,迭代分支包括認知、推理和決策。新財年以來,LMA持續最佳化、認知分支聚焦多模態表徵、推理分支聚焦搜尋推廣領域的使用者行為大模型等。這些技術進展不僅推動了第一階段體系實現多個版本迭代上線,還深度改造了認知、改寫、相關性和創意等核心技術模組,推動技術全面升級。
明線,推理偏置(Induction Bias)的合理設計,是模型能力提升的核心驅動力。 暗線,硬體算力的指數級提升,為模型的規模化提供了強力支撐。 輔助線、CV和NLP領域的代際性技術升級,給搜推廣領域帶來重要啟示。

AlexNet 在 ImageNet 競賽中的突破性成功表明了 DNN 的巨大潛力,搜推廣開啟 DNN 時代;
Word2Vec奠定了表徵的基礎啟示,使嵌入技術得以廣泛推廣的廣泛應用;
注意力機制對翻譯任務的大幅提升,深度影響使用者行為興趣建模;
基於Transformer結構的訓練正規化的普及,推動了對比學習、掩碼學習、預訓練和遷移學習等多種迭代模式的興起。
一方面,從算力(暗線)角度來看,縮放法則在稀疏的更寬方向已經表現出第一生長曲線,新時期需要探索稀疏往稠密的轉變,走出更深的新生長;
另一方面,從偏見(明線)角度來看,人工先驗的偏見由精細化設計向樸素化正規化轉變。 正如《苦澀的教訓》所言:“AI發展史最苦澀的教訓是:試圖將我們認為的思維方式編碼硬進AI,長期來看是無效的。最後重要的,是那些能夠隨著計算能力高效增長而擴充套件的通用方法”。這一點緊迫感同身受,過去依賴精巧結構設計的短期收益,往往在算力提升的長期趨勢下變得微不足道,甚至有些複雜結構反而成為算力擴充套件的障礙。真正支撐生產服務的模型,最終仍會朝著簡潔、簡化、方向的收斂,以適應計算資源的可擴充套件性和實際業務需求。
訓練模式,包括分類、對比學習、掩碼學習、自迴歸學習等,且骨幹緊隨主流更迭,包括BEiT3、BGE、BLIP2、EVA2等。
資料質量、圖文質量包括視覺強相關的主體和關鍵詞識別、難正負樣本挖掘,結合行業特色挖掘興趣樣本例如拍立淘的圖搜場景等。
規模效應,包括圖片尺寸、訓練樣本和模型引數,模型尺寸經歷了0.1B、1B和10B的升級過程,是更深層次規模化的主要路徑。


【LUM】基於三步正規化的大使用者模型解鎖工業推薦系統中的縮放定律
論文連結:https://arxiv.org/abs/2502.08309
【UQABench】UQABench:評估使用者嵌入在個性化問答中提示 LLM 的效果
論文連結:https://arxiv.org/abs/2502.19178


