5 月 20 日,網易互動文娛產品釋出會在廣州舉行。除了釋出《寶可夢大探險》、宣佈與漫威合作之外,在這場活動中《倩女幽魂》手遊公佈的虛擬形象「阿初」,也讓我們關注到了背後的技術支持者伏羲人工智慧實驗室。
網易旗下知名手遊《倩女幽魂》正式公佈了「阿初」,和此前出現在電視臺播報新聞中的虛擬主播不同。網易在遊戲中的 AI 虛擬形象試圖探索未來人機互動的方式:它是隨時可以和你互動的,所有行為、對話都是人工智慧技術實時產生的。「阿初」將是之後打造虛擬形象的切入口。
人工智慧虛擬形象是具有人物「實體」,能夠與玩家進行直接交談的軟體系統。在交流的過程中,智慧虛擬人不僅可以和你自然對話,還能根據交流的意圖,展示相應的面部表情和肢體語言。更重要的是,它還能夠模擬人的認知能力,採取合理的語言和行為策略,與使用者進行情感互動,激發、察覺和回應使用者的情感。
網易表示,虛擬形象被可視為多種人工智慧技術的集合,其中涉及了語音識別與合成、自然語言理解、影像視覺處理、使用者畫像和大資料等技術。它也是一門交叉學科,還融合了美學,心理學和社會學。虛擬形象或許會成為下一代人機互動的主要形式之一。
阿初是《倩女幽魂》手遊新版本的重要內容之一。
新產品的背後是網易 AI 技術的研發能力。在「AI 虛擬偶像」揭幕之前,我們與網易伏羲 AI 實驗室負責人李仁杰進行了對話,他向我們介紹了「阿初」背後的故事,以及這家機構在人工智慧研究上的發展,和對遊戲 AI 發展趨勢的預測。
「網易一直在探索遊戲的未來,遊戲最終的形態可能是虛擬現實化,抑或現實虛擬化。而人工智慧可能是通向這條道路的唯一途徑。」李仁杰表示,「網易早在 2017 年就已經開始佈局。抱著用人工智慧點亮遊戲未來的願景成立了伏羲實驗室,這也是全國首家專業遊戲 AI 研究機構。經過一年半的沉澱,如今已經在人工智慧落地遊戲應用中做了很多探索和研究。」
李仁杰博士畢業於羅切斯特大學,曾就讀中國科學技術大學少年班。
在 2017 年成立時,伏羲只有二十餘人。隨著專案增多和研究的開展,這家機構已經發展成為網易的一級部門,成員也增至 140 餘名,其中的 95% 屬於技術研發人員,展示了網易探索人工智慧技術的決心。
據李仁杰介紹,網易伏羲的人工智慧研究目前被分為五大方向:強化學習、自然語言處理(NLP)、影像處理、使用者畫像以及虛擬偶像。此外還有支援這五大方向的大資料和 AI 計算平臺。
全面的 AI 應用
在這些方向上,伏羲的技術都已有了應用。說到遊戲中的人工智慧,近來最為人們所熟知的就是 DeepMind 打星際爭霸的 AlphaStar,以及 OpenAI 提出的,在 Dota2 擊敗 TI8 冠軍隊伍的 OpenAI Five,這些 AI 的背後都是強化學習演算法。與它們相似的是,在網易,強化學習可以讓遊戲裡的 AI 更像人類。
大家在遊戲中人機對戰時常常會感覺有些無聊:電腦的行為都是按照規則樹寫出來的,我們打 boss 時在熟悉套路之後就純粹是刷裝備了。人工智慧的加入可以讓 AI 依照玩家發出的技能實時展開應對,併產生自己的策略,這樣在遊戲中每一局都會遇到不同的情況。戰鬥 AI 還可以接替掉線的人,這樣就不會損害其他玩家的使用者體驗。
在《潮人籃球》等手遊裡,網易已經上線了基於強化學習的 AI 控制人物。「其實在這類遊戲裡,常規電腦依賴的自寫規則開發起來更加耗費時間——人們很難編寫出完美的籃球類 AI,覆蓋在球場上出現的各種可能性。更不用說在遊戲中每名角色還有不同的技能了。」李仁杰介紹道,「如果用強化學習的方法,模型一兩天就能訓練好了。這些 AI 實現起來則是在雲端進行運算,無需耗費手機算力。」
人工智慧除了可以學會人類的遊戲方式外,還可以掌握一些超出常規的技巧。在《逆水寒》中,伏羲的研究人員發現 AI 可以進化出一些人類無法完成的操作,比如在兩個技能之間加一個隱身來躲避對方的大招。
在 AI 訓練的「自我博弈」過程中,人工智慧可以學會一些高階操作方式:AI 甲先是學習了 A、B 兩個大招同時放,因為互相可以疊加收益,傷害更高。隨後 AI 乙學會了用技能 C 來驅散 AB 大招的效果。之後 AI 甲將策略改回 A、B 分開放。相對應的,AI 乙開始選擇用技能 C(因為有冷卻時間,所以一段時間只能放一次)來只驅散傷害更高的那個技能。AI 甲在「看到」這個情況之後,又在訓練中學會了騙技能——先想辦法用傷害低的技能來騙掉對手的驅散,再施放傷害高的技能。
伏羲也在把很多玩家想象中的「高智商 NPC」轉化成為現實。去年 12 月份,網易在《倩女幽魂》手遊裡上線了智慧養育系統,工程師們在其中開發了出了可以互動的小孩。它有 0 歲、5 歲、12 歲三個階段的成長過程。這個系統模仿了新生兒的狀態:從牙牙學語到通讀詩書。最終階段的 AI 兒童可以回答關於遊戲的問題,也可以寫五言、七言絕句,完成藏頭詩這樣的創作。
這項機制使得在推出虛擬形象之前,《倩女幽魂》手遊已成為世界上第一個擁有對話式 AI 技術的 MMORPG(線上多人角色扮演遊戲)。在其中的聊天機器人可以自我學習,不斷地成長,並根據你養育的方式成長為不同的性格。
影像是遊戲體驗的重要部分,很多角色扮演遊戲正嘗試讓玩家自定義角色,但對於遊戲者而言,「捏臉」是一種耗費時間且難度很高的工作。伏羲 AI Lab 因此為《逆水寒》開發了面部捕捉智慧捏臉系統,只要你上傳一張照片,面部識別技術就可以把你的臉生成一個 3D 模型,同時也符合遊戲的年代設定(逆水寒遊戲的設定是宋朝時期,AI 輔助捏出來的臉也會符合古代人的面部特徵)。
使用者畫像是 AI 領域裡貼近業務轉化的前沿研究方向,與傳統的資料探勘不同,人工智慧的演算法賦予了「使用者畫像」全新的生命力:
伏羲 AI Lab 通過研究玩家的行為序列、軌跡序列,結合影像視覺技術,實現了對遊戲外掛群體的高效打擊;
研究玩家連續行為和文字序列,實現了對玩家遊戲行為、遊戲趨勢的預測;
利用玩家的歷史戰鬥結果和實時對戰表現,實現了遊戲多人對戰的匹配平衡;
繪製玩家的社交關係、交易關係圖譜,讓遊戲玩家邂逅命中註定之人;
分解遊戲行為的回報,幫助開發者獲得精準的遊戲數值評估。
在構建屬性來刻畫玩家的過程中,伏羲不會侷限在一些統計類的特徵構造上,而是使用 AI 演算法來預測玩家抽象層面的屬性,也會使用一些無監督的方式來自動生成一些屬性標籤。當然,最強大的畫像構造能力在於可以從海量的行為資料、聊天資料、關係資料中自動生成玩家的隱含屬性特徵並實現特徵解耦與可解釋,這些隱含屬性特徵將在上層業務中發揮出巨大的價值。
除了遊戲角色智慧化、提升玩家體驗之外,在遊戲開發的過程中,人工智慧技術也可以提高開發者們的生產效率。伏羲正在幫助構建 3D 人物模型的遊戲製作者們提升模型蒙皮、骨骼、皮膚,以及服裝的實現速度和擬真程度。
讓模型自然地動起來需要的技術門檻很高——通常讓角色完成一套約 30 秒鐘時長的動作需要兩個小時的設計時間,而通過網易積累的大量人物動作資料,人工智慧學習並形成動作只需要 3 分鐘,可以減少 97% 的時間。
「在構建屬性來刻畫玩家的過程中,我們不會侷限在一些統計類的特徵構造上,會使用 AI 演算法來預測玩家抽象層面的屬性,也會使用一些無監督的方式來自動生成一些屬性標籤。」李仁杰介紹道,「當然,我們更強大的畫像構造能力在於可以從海量的行為資料、聊天資料、關係資料中自動生成玩家的隱含屬性特徵並實現特徵解耦與可解釋,這些隱含屬性特徵將在上層業務中發揮出巨大的價值。」
理論研究
「AI 最難的是技術落地,每一個創業公司和大型科技公司都在尋找落地的場景。」李仁杰表示,「而遊戲作為虛擬場景可以達成很多現實世界中難以呈現的想象力空間,為 AI 找到了呈現之路。在伏羲 AI Lab,我們不會為了研究而研究。但在技術落地過程中解決的難題,如對技術發展有推動意義,則會形成論文發表出來。」
除了面向應用的研究,網易伏羲 AI Lab 最近也活躍於 KDD、NeurIPS 等人工智慧頂級會議上,李仁杰博士向我們介紹了最近該機構在一些會議上發表的論文:
這其中包括國內第一次中 ACM IVA 的論文《Text-driven Visual Prosody Generation for Embodied Conversational Agents》首次提出文字生成動作和表情(此前的研究都是語音生成);KDD 2019 論文《MVAN: Multi-view Attention Networks for Real Money Trading Detection in Online Games》;以及 SIGGRAPH 2019 論文《NeuroSkinning: Automatic Skin Binding for Production Characters with Deep Graph Networks》。
在剛剛公佈接收結果的 IJCAI 2019 上,伏羲實驗室有四篇論文上榜:
《Deep Multi-Agent Reinforcement Learning with Discrete-Continuous Hybrid Action Space》;
以及《Explicitly Coordinated Policy Iteration》、《Reinforcement Learning Experience Reuse with Policy Residual Representation》和《Value Function Transfer for Deep Multi-Agent Reinforcement Learning Based on N-Step Returns》。可以看到,網易伏羲 AI Lab 的論文包含玩家行為研究、計算機視覺和強化學習等方面的研究,幾乎包含了遊戲領域 AI 的發展所有方向。
為了降低強化學習在遊戲落地的門檻,伏羲實驗室還研發了強化學習 SDK,讓不懂人工智慧技術的遊戲策劃也可以像呼叫普通函式一樣呼叫會自動學習的神經網路函式。「主要的技術難點、麻煩事、前期準備都由我們承包了,大家的開發過程會更加輕鬆愉快。」李仁杰介紹道。
網易伏羲實驗室展示了自己的吉祥物「伏小羲」。
作為從遊戲部門中誕生的 AI 研究機構,網易伏羲實驗室與遊戲研發的關係非常緊密,不過採用新技術能否真正的給玩家帶來價值,還需要通過實踐來檢驗。在遊戲中引入 AI 還是一種新的嘗試,如何說服產品同事接受並使用新技術是伏羲 AI Lab 在未來會遇到的挑戰。
「與其他娛樂專案不同的是,遊戲可以帶來沉浸式的互動體驗。」李仁杰表示,「人工智慧在很多方面都可以有作為:它可以讓遊戲的畫面變得更好、體驗變得更好,也更懂玩家。」
在不斷探索的過程中,遊戲也會促進很多新技術的進步。GPU 的快速發展就是最近的一個例子。
「遊戲一直在推動新的娛樂模式出現,比如直播。AI 加持的遊戲,終極形態可能會是《西部世界》中的樣子。當然,我們前面的路還很長。」李仁杰說道。