4800個大模型團隊競逐「產業真題」,這場金融科技大賽火出圈了

机器之心發表於2024-09-06
今年 7 月,一份《全球數字經濟白皮書 (2024)》統計顯示,全球目前已有 1300 多個基礎大模型,美國的數量最多,中國緊隨其後排在第二。

這一數字對比說明,在大模型這張「牌桌」上,中美是最具實力的兩個玩家。曾經,中國奮力追趕「OpenAI 們」,兩年之後我們可以看到,國產大模型在技術層面已抵達全球第一梯隊。

而在這個過程中,圈內玩家逐漸分化出兩條路線:一派繼續卷效能,一派專注搞應用。

國內的優勢恰恰在於產業場景極其豐富,落地空間極其廣闊。面向大模型的下半場戰事,業界普遍認為,中國將在應用層展現出更強的後勁。

目前的核心問題是,如何讓大模型技術儘快與更多真實的產業場景連線起來。

從何處入手?一是精準定位最需要大模型的產業場景,二是找到能解決這些真實場景問題的人才。

一場直面「產業真命題」的技術賽事

我們熟悉的大模型落地案例更多發生在對話、作畫、影片等方向,但其價值遠不止於此,大模型同樣可以深刻改變城市發展、金融科技、生物醫藥、工業製造、科學研究等領域。

已連續舉辦兩屆的 AFAC 金融智慧創新大賽,正在成為國內大模型人才競逐金融產業真命題的賽場。

AFAC2024 金融智慧創新大賽(以下簡稱 AFAC2024 大賽)以金融行業內真實案例及海量真實資料為牽引,鼓勵參賽者直面金融產業真命題,探索最具挑戰的創新模型和演算法。在去年賽制的基礎上,AFAC2024 大賽對比賽形式進一步升級,在「挑戰組」之外新增了「初創組」和「企業組」,形成了涵蓋演算法賽、應用賽和創業賽的綜合賽制架構。

螞蟻集團副總裁、螞蟻金融技術委員會主席王曉航表示,舉辦 AFAC2024 大賽的出發點之一就是集聚、培養優秀科技人才、開展高水平合作交流。

同時,大賽設立了豐厚的獎金池,併為選手提供了配套的技術支援,吸引了數千個極具潛力的大模型團隊參與。值得注意的是,選手們可以基於螞蟻開源的 agentUniverse 多智慧體框架,對多智慧體協作模型進行開發定製,輕鬆構建智慧體應用,節省更多精力以專注於破解產業命題。

3 個月,4882 支隊伍的技術探索,讓這場比賽「卷」出了新的高度。中國最頂尖的一批大模型人才圍繞金融場景下的眾多產業真題,貢獻了眾多前沿解決方案。

「我們始終相信透過科技的力量可以帶來更多微小而美好的變化,我們期待 AI 能讓高質量的金融服務惠及每一個人,讓更好的金融產品進入千家萬戶,成為人們生活中的一部分。」王曉航表示,「人工智慧技術的作用和價值不應僅限於研究和模型能力,更應產生更大的應用價值,就像掃碼支付一樣能夠進入千家萬戶,進入每一個行業。」

接下來,讓我們來看看三個代表團隊的技術創新故事。

什麼樣的金融研報生成應用
能從六百多支隊伍脫穎而出?

「擁抱 AIGC」團隊的三位成員有很多共同點:都就讀於浙江大學軟體工程專業,都是碩士二年級的研究生,甚至住在同一個寢室。除了研究方向不太相同:三人分別選擇了計算機視覺、資料治理與大語言模型、時空資料作為主攻方向。

隊長高天弘曾參加過首屆 AFAC 大賽,關注到 AFAC2024 大賽啟動之後,他決定拉上室友再挑戰,儘管「金融智慧」對於三人來說是有些陌生的領域。

一番深思熟慮之後,他們選擇了「AIGC 金融多模態研究報告智慧生成」這個賽題。團隊需要將大模型技術和金融資料深度融合,提出有創新價值的金融研報生成智慧體解決方案,並應用於實際場景。

大模型的通用能力在不斷進化,但要想解決高水平問題,還要靠行業知識的進一步積累。縱觀當前的各類對話式 AI 應用,生成真實、有用、高水平的研究報告仍然是一項極具挑戰性的任務。特別是對於金融這種專業門檻極高的領域,資料時效性、長文字總結、圖表生成等都是其中存在的挑戰。

如何有效攻克?特別是在賽題釋出後,留給團隊完成方案設計的時間並不算多。

針對上述問題,他們設計了一個面向金融研報生成的多智慧體協同框架。具體來說,這個框架包含三層:多後設資料來源、金融研報生成智慧體 Agent、多源大語言模型

與傳統的對話系統不同,協同的智慧體具備任務規劃和執行能力,能夠在無需人類干預的情況下自動處理複雜問題,包括生成研報:

圖片

其中,團隊以 FinGPT-Forecaster 為基礎,結合 LoRA 微調,訓練了一個用於投資評級分析的股價預測大模型,克服了 ChatGPT 預測含糊和資料隱私問題,提供了可解釋的預測結果。

圖片

為了更高效地篩選金融資料,同時保證實時性和專業性,團隊設計了一套多源檢索增強方案。在檢索獲得行情、研報、股價等資訊之後,首先針對走勢圖、PDF 研報等多模態資料進行預處理,突破單模態分析的侷限性,使市場波動更直觀呈現。然後從相關性、市場敏感性、可靠性、時效性多個維度出發,使用基於 LLM 的重排器進行排序最佳化。在這個過程中,作為賽事主辦方之一,螞蟻集團提供了新聞資訊助手 API ,保證了資料收集的實時性,也大大減少了資料處理的工作量。

圖片

最終,這一方案在同賽道的六百多支隊伍中脫穎而出,奪得冠軍。獲獎之外,三位成員透過這次比賽也學會了如何理解現實中的產業需求,又如何面向真實產業場景制定具備可行性的方案。

圖片

他們更加深刻地體會到大模型與傳統 AI 研究的巨大差異。此前的 AI 模型基本面向具體任務而設計,僅用少量資料訓練就可達到目標效能。相比之下,從底層訓練的角度說,大模型對資料、算力的要求已經實現了指數級增長,對訓練大模型的人的創新能力要求顯然也更上一層樓。

用大模型打造「一對一」旅行智慧助理

在「初創組」的賽場上,「智遊幻境 Odyssey Agent」團隊的成果讓評委們印象十分深刻。

這個團隊由五位熱愛旅行的年輕人組成。眾所周知,旅行的回憶是美好的,但旅行前的規劃是千頭萬緒的。出行的人常常花費大量時間輾轉於各個平臺之間,獲取資訊、制定行程、預定服務,如果涉及出境遊難度更甚。

以 Gemini、ChatGPT 為代表的對話式 AI 應用,也具備提供旅行資訊推薦的能力,但往往只有「第一次可用」。很多時候,如果我們繼續追問,後續對話可能很難與前面所談行程保持一致。而且這些基本只能整合單個平臺的資訊,無法做到有效整合旅行過程中全部所需資訊。

能不能做一款提供一站式定製旅行服務的大模型應用呢?五個人一拍即合,決定打造一個「旅行規劃智慧助理」。儘管團隊中有幾位成員在大廠的工作非常忙碌,但他們還是利用業餘時間快速打造出了這個專案的雛形。

圖片

具體來說,他們參考 agentUniverse 多智慧體框架的互動模型設計思路,針對旅行場景搭建了一套多 Agent 協作體系:「CHaTS」(Consult,Hotel and Transportation,Spots)。

生成一個七日行程平均要呼叫大語言模型 50 餘次,能在 3 到 5 分鐘內返回一個城市的旅行規劃和遊記 Vlog。對於使用者來說,最大的體驗提升就是推薦的攻略細節真的更豐富了。

圖片

由於涉及到多個大語言模型生成機制,為了避免前後行程矛盾、關鍵資訊的遺忘以及 token 長度和整體成本問題,團隊引入了共享記憶和 tool memory 機制。具體來說,他們將相關工具的執行結果(比如機票 / 酒店查詢結果、每日景點推薦),在簡單地預處理後進行本地儲存,或者透過 Qwen 模型的 File 編碼的形式儲存在雲端,降低了頻繁呼叫工具造成的時間和經濟成本,也避免了模型在重新推薦時產生幻覺或者矛盾衝突。

儘管目前的「智遊幻境」還處於早期版本,卻恰好展示了大模型在旅行類應用賽道的想象空間。團隊表示,未來的「智遊幻境」可以引入更強的大模型、更多的模態、更豐富的場景。比如透過 VR/AR 裝置、無線耳機、攝像頭等裝置的聯動,這款應用可以變為一個能看、能聽、能說的「導遊」,帶來更沉浸的旅行體驗。

從觀光推薦到實時翻譯服務,這樣一款應用真的有可能徹底改變旅行者與世界互動的方式。

讓大模型融入科技金融業務的「系統工程」

相比於挑戰組和初創組,大賽的「企業組」賽道主要著眼於科技金融行業的新興方向,鼓勵科技金融行業的中小型企業提報有亮點、有新意的新技術、新產品落地專案。

深擎科技是一家成立六年的公司,多年來利用 AI 與大資料分析技術,為券商銀行提供智慧投顧助手和個性化內容生成相關產品,也見證了大模型技術的興起和爆發。

在數十家參賽企業中,深擎科技提交的方案受到了較多的關注。簡單來說,他們圍繞 AI Agent 的基座,打造了一整套行業「剛需」的應用產品體系。

對於那些想用大模型變革自身業務的金融機構來說,在實踐中往往會遇到一些挑戰:如何快速響應業務需求,讓業務參與到大模型應用場景的打磨中來?投入的大量配套研發,如何沉澱,運算元化、可複用的最佳實踐?如何量化評價場景效果,上線後如何持續最佳化迭代?

核心的問題就是,技術的快速迭代與金融業務所需的確定性之間,如何平衡?

深擎科技給出的解決方案是 AI Agent 平臺「乾坤圈」,將大模型能力融入到金融業務的「系統工程」之中。

圖片

在不同基礎模型各有所長的今天,「乾坤圈」的一大亮點是支援多個基座大模型協作完成業務交付,且支援本地化、SaaS 大模型服務接入,相容主流的開源和閉源模型。

此外,「乾坤圈」還提供了敏捷的 AI 場景構建模板和工具,讓機構以低程式碼甚至無程式碼的方式迅速構建業務場景應用,解決了大模型落地中容易產生的「重複造輪子」問題。

基於「乾坤圈」,以往業界存在的金融領域大模型幻覺控制、業務資料和知識接入、生成結果合規安全性、產研運營端到端效率和生成結果質量評測問題,都得到了有效解決。

實際上,「乾坤圈」平臺的技術探索也代表了當前大模型落地的整體趨勢,對於很多專業門檻較高的領域來說,只有面向真實的產業場景設計垂直解決方案,才能實現以技術解決真問題的初衷。

目前,深擎科技的產品已經實現 PMF(Product Market Fit),覆蓋了 80% 的大中型券商和 50% 的大型銀行,近幾年的主營收入年複合增長率超過 80%。

圖片

接下來的階段,大模型技術與金融業務場景的結合也會越來越緊密,深擎團隊希望持續完善「乾坤圈」,在大模型和金融行業的交叉領域做更多從 0 到 1 的創新,為金融機構實現「數字化、集約化、精細化」客戶經營提供動力。

期待大賽能誕生出中國的「OpenAI」

在有關大模型的討論中,「人才」始終被認為是非常關鍵的競爭要素。

以 AFAC2024 大賽為代表的技術賽事之所以備受矚目和火爆出圈,因為它既能提供一方培養 AI 人才的土壤,也切實給到了這些高潛力 AI 人才需要的扶持資源。

比如,對於「擁抱 AIGC」團隊來說,這是一次走出校園、直面產業真題的寶貴機會;對於「智遊幻境」團隊,這是一次走上廣闊舞臺、驗證自身設想的契機;對於「深擎科技」團隊,這是一次與業內最頂級同行比拼、促進自我提升的精彩旅程。

縱覽 AFAC2024 大賽的 4800 多支隊伍,「年輕化」和「多元化」也是本次參賽群體的一大特質。但這些年輕的隊伍卻做到了對前沿技術的極致追求,以長遠的眼光去看,未來中國的「山姆奧特曼」和「OpenAI」,很可能就誕生在這些充滿技術熱情的隊伍中。

AFAC 組委會相關人士表示,希望大賽裡湧現的出來各種優秀人才,能成為國內大模型領域的中堅力量,最終造福於整個行業的發展和創新。

相關文章