只是裝了一個 App,整個生活就 AI 了 。
家人們,支付寶已經這麼「炸場」了嗎?
輸入「買一張週日的高鐵票,從北京到武漢, 下午出發,行程時間最短的一趟」, 點選三次,等待數秒,購票成功!以前跳轉幾個頁面、點選十幾下才能搞定,感覺像是一個段子。
隨著國內各大網際網路平臺紛紛推出專門的 AI 原生應用,國民級應用支付寶也向等待已久的市場交出答卷——一個全新的 AI 原生應用「支小寶」。
不少 AI 原生應用像一個全能助手,你可以問任何開放性問題,TA 都能回答,儘管也不那麼篤定。
但「支小寶」不同,作內首款辦事型 AI 生活管家,TA 生動展示了大語言模型的應用如何從理解( Chat )轉向採取實際行動( Act )。
支付寶已經誕生 20 年,每天都有數億人用它支付、出行、理財、就醫、辦事。做普通人的「生活百寶箱」,也一直是它的底色。而今,進入 AI 時代,「支小寶」正接力支付寶,希望人工智慧也能像二維碼服務一樣,未來惠及每一個普通人。
一、只要一句話,生活就 AI
乍一看, AI 原生應用就和移動網際網路原生應用(支付寶)很不同。
單一藍色的配色方案,配以極簡的介面設計,讓人倍兒感清爽。「此刻」、「對話」 分別對應「支小寶」兩個核心能力,主動陪伴和跑腿辦事。「智慧體」示意「支小寶」未來要交很多朋友。
一個對話方塊「包打天下」:只要你一句話,叫車、訂票、充話費服務立刻直達。
體驗一番後發現,日常就這樣被大模型給擺平了。
早上叫醒打工人的不是夢想,而是咖啡,只用說句「點杯瑞幸咖啡的生耶拿鐵,到店取」,搞掂!
「支小寶」會將取餐碼,連同天氣和要聞「寫到」便利貼上,貼到「此刻」公告欄。
車站附近掃碼取咖啡。發現車快來了,點開「隨身口令」,「我要坐公交」,乘車碼立刻彈出來。
本著「能動手就不要動口」的精神,召喚剛需服務的「口令」已經進化成模版。
早會完畢,接到下週出差的任務,只需在對話方塊說清要求,如出發地、目的地、時間、甚至票價高低,就能一鍵搞定,身份證號都能幫你填好。
午飯時間,「此刻」自動更新到中午狀態,前幾天網購的包裹已經到了。
天氣太熱,上個月電費花了多少?開啟一看,不出所料,充值繳費多半都是電費支出。
充話費、給閨蜜轉賬,啥都不用自己填, 「支小寶」直接搞定。
晚上,依舊咳嗽不止,白天還發燒,該掛什麼科?「支小寶」請來健康醫生作答,確認科室後,直接將醫院掛號入口找了出來。
過去多次點選才能完成的事兒,現在只需一句話,AI 就能幫你辦好。很多生活百科問題,「支小寶」也能整合網路內容回答你。
透過「對話」,你可以享受一句調動日常服務的快感。進入「此刻」,因為擁有場景感知系統,「支小寶」會基於你的日常習慣、空間位置主動給到陪伴。
TA 就像一個聰明的公告欄,實時將 To-do list 事項更新至此。除了實時更新的天氣和新聞,快到地鐵站了,乘車碼會自動冒出來;快遞到了,取件碼會被貼在首頁。如果你在黃山,請出「智慧體」裡的「黃小松」就能獲得更地道的本地服務。
二、 用硬科技狠活兒滿足最接地氣的需求
「支小寶」有點迷惑性。
當產品體驗絲滑到「無感」後,人們反而容易忽視沉澱在下面的深刻技術,甚至會有「這也不難做到」的錯覺。
沒有底層的模型和演算法能力創新,就不可能有產品上的「一鍵上翻支付寶百萬級小程式」、「讓 8000 萬數字生活服務『觸手可得』」。
和大模型理解使用者意圖後直接呼叫商家介面的做法不同,「支小寶」使用了一個名為 ACT(Transformer for actions )的智慧服務技術,讓智慧助理具備螢幕感知與模擬執行能力,就像讓 AI 有了「眼睛」和「手腳」,模擬人類互動(如點選、滾動和輸入)下單、訂票。
ACT 會先利用大語言模型來理解使用者的自然語言需求,然後將其轉化為一系列具體的操作指令。這使得使用者無需手動操作多個介面,只需用語言表達他們想要的東西即可。為了實現這一目標,支付寶在多個方面進行了探索和創新。
首先,支付寶實現了多模態資料採集,除了行為資料,還有頁面的圖片、數字、按鈕、輸入框等各種元素,使系統能夠「看到」並理解當前的使用者介面。這就像給機器人裝上了眼睛,讓它能夠準確地在介面上操作。
有了「眼睛」還不夠,跑腿辦事還得有「四肢」,圍繞支付寶框架和容器能力,他們自建了一套模擬執行能力,針對性地解決了在支付寶 App 上做模擬執行的問題。
為了提供更好的使用者體驗,ACT 採用了「離屏」方案,將整個操作過程隱藏在使用者視線之外。這樣,使用者就不會看到中間的操作過程,體驗更加流暢。
除了這些會見諸媒體報導的底層創新,更多技術和能力沉澱在了超級應用裡。
為了提升大模型的行動力,支付寶還最佳化了 Function Call(函式呼叫)。透過採用函式表達和顯式推理等高階 Prompt 技術,顯著提升了大模型理解和呼叫合適工具的能力。更值得一提的是,他們還利用實際業務場景的複雜資料來訓練模型,這大大增強了模型的「實操」能力。
作為一個泛生活服務數字平臺,支付寶的服務生態非常豐富。現在,藉由 AI 將平臺 8000+ 數字生活服務、400萬+ 小程式重新連線起來,這一舉措堪比支付寶當初透過一張張二維碼構建起移動支付網路,對工程化落地能力提出了極高要求。
而系統工程能力正是中國這些日活過億超級應用的強項。「亞運數字火炬手」活動吸引了超過 1 億人參與,「五福節」活動更是支援了 6 億人次的 AI 互動,這些成功案例不僅證明了支付寶在處理海量使用者請求方面的卓越能力,更展示了其在解決大模型應用規模化落地中的關鍵問題,如算力支撐和成本控制等方面的領先實力。
ACT 正在從端側渲染向端雲協同渲染過渡。這種轉變雖然工程複雜度很高,但對於「支小寶」這類對響應速度要求極高的產品來說至關重要。特別是 ACT 技術所需的容器級別雲渲染,比起「五福節」中使用的單純介面渲染要複雜得多,對工程能力的要求也更高。
三、支付寶的「內生」:
不止於 All in AI,而是 AI in All
二十年來,中國人的購物方式和日常生活發生了翻天覆地的變化。人們可以使用二維碼移動支付,而不必再使用信用卡。手機上不僅能買機票、電影票,還能叫車、繳費、掛號甚至領結婚證。支付寶成了「生活百寶箱」,但從「百寶箱」立刻翻出你要的東西,也是不易。
今年4月,支付寶將 AI 引入整個平臺。在首頁開啟測試全新 AI 產品支付寶智慧助理(「支小寶」前身),同時在多個場景接入了智慧助理:搜尋、出行頻道、市民中心。
拉下支付寶 App 首頁,就能喚起,起到「App 智慧導航」的作用。後因探索 AI 原生應用,為使用者提供更極致的體驗,又有了獨立 App「支小寶」。
由此可見,ChatGPT 和 LLMs 大熱 ,每個公司都會選擇最合適自己的方式跟進。
OpenAI、Anthropic、Mistral 等將聊天機器人作為一個神奇的通用介面,追逐一個可以提問任何開放性問題的全能助手。而支付寶給出了另一種選擇,轉向更加務實的應用層,看看能幫助使用者解決什麼問題。
選擇利用其現有的產品生態和經過市場驗證的剛需(衣食住行)落地新技術,支付寶降低了試錯成本,還能更快地獲得市場反饋。即便某些產品可能失敗,也能獲得寶貴經驗,嘗試越多越有利。
因此,支付寶選擇的第一個方向是「內生」,用 AI 煥新整個平臺,不止於All in AI,而是 AI in All。他們並不聲稱,新的基礎模型在所有方面都是最好的,但對於他們想要煥新的功能來說,一定要足夠好。
其實,找到一個合適場景,把先進技術變成一個普惠服務,一直是支付寶最擅長的。螞蟻集團 CTO 何徵宇說過,「支付寶過去和今天的技術發展思路是一樣的。」
這款國民應用今日之大成,不是基於「上帝視角」的預先設計,無非是見山修路,見河搭橋,雖然也在激烈的競爭中走過彎路,但有一點始終沒變:我能為使用者解決什麼問題?如何讓服務更簡單、更敏捷?圍繞核心業務體驗,把硬核技術吃透。
當然,因為核心是智慧體(AI Agent),「支小寶」的未來並不像它帶來的體驗那麼「簡單」。
「支小寶」能以多種形式承載並服務使用者,透過專業智慧體的深度連線,使用者會感受到服務體驗的代際升級。但,這也需要千行百業和無數 ISV 一起來「種草」。
今天的外灘大會上,支付寶面向行業正式啟動智慧體生態開放計劃,並推出了一站式智慧體開發平臺「百寶箱」,依託智慧體構建能力,商家機構可 0 程式碼、最快 1 分鐘建立專屬服務智慧體,並一鍵釋出到支付寶生態圈。
今天的外灘大會上,支付寶面向行業正式啟動智慧體生態開放計劃。
此前,支付寶已經開始打樣。
他們攜手安徽黃山風景區,打造了國內首個「全程 AI 伴遊」景區。外地遊客抵達黃山後,開啟「支小寶」就能快速進入黃山智慧體,開啟 AI 伴遊。
支付寶和浙江衛健委聯合推出的數字健康管家「安診兒」,背後也是一個連線多個醫院與機構的智慧體生態。
二十年前,支付寶發明了快捷支付,它對整個中國移動支付發展的貢獻要在很多年後才會顯現出來。二十年後,支付寶設想了一種新生活,演化的進度條開始讀取中。