遊戲AI三大難:樣本大、成本高、靈活性差

陳佩佩發表於2021-06-24
遊戲AI三大難:樣本大、成本高、靈活性差

DeepMind“入侵”安卓遊戲了

繼攻克圍棋、《星際爭霸》後,DeepMind開始瞄準手遊了。

5月初,DeepMind推出 AndroidEnv後,開始密集測試諸多手遊。最新加入體驗挑戰的是安卓版《The Battle of Polytopia》,它由瑞典開發商Midjiwan 製作併發行,是一款回合制文明策略遊戲。

遊戲故事背景設定在一個奇異而又平坦的“方塊”星球。玩家可領導 12 個不同文明中的一個,擴張帝國、研究科技併成為整個星球的統治者來最終取得勝利。

遊戲擁有單人和多人模式,最多可支援 12 名玩家。

目前,Midjiwan 正跟DeepMind合作,將《The Battle of Polytopia》整合到AndroidEnv中,成為後者一項常規任務。

大爆炸,變革性體驗要來了?

“我們發現這款遊戲是一個特別有趣的挑戰,因為它有許多功能,如處理長期規劃、不完善資訊、多樣化 UI 元素和非確定性。”DeepMind 評論說。

遊戲AI三大難:樣本大、成本高、靈活性差

針對本次合作,Midjiwan 總經理Christian L?vstedt則表示,DeepMind 是人工智慧領域巨人般的存在,能擁有這樣強大的合作伙伴,併成為平臺一份子,我們感到非常自豪和興奮。

在Polytopia玩家群體中,不乏資深玩家。融入人工智慧後,想必也會給玩家體驗帶來不一樣的變化。

AndroidEnv作為一個AI平臺,允許AI代理在遊戲中自定義任務,比如尋找公園的方向、預定航班甚至於獲取最高分。

AI代理主要依據螢幕上顯示的影像做出決策,它能像人類一樣通過觸控式螢幕和手勢進行操作。

理論上,AI能夠幫助開發者實現內容快速生成、自動生成劇情,乃至促進NPC智慧化和多風化。

以騰訊AI Lab為例。在競技博弈AI方面,騰訊AI Lab推出了絕藝跟覺悟。前者主要涉及棋牌專案中的圍棋和麻將,完成從完全資訊博弈到非完全資訊博弈的擴充。

後者主要涉及到MOBA類手遊《王者榮耀》及體育類的足球,分別在異構分散式multi-agent和更多智慧體+長配合方面進行探索嘗試。

筆者獲悉,《王者榮耀》專案組一直在嘗試各種新玩法,但效果往往不盡如人意。意外的是,AI人機對戰參與率極高,超過10%的玩家。

這意味著,日活使用者達到大幾百萬。官方披露的資料顯示,AI覺悟挑戰共吸引超過數千萬玩家參與。

此外,基於AI對於遊戲理解的專業策略分析和聲音文字的綜合體現,騰訊也推出了王者榮耀虛擬主播。

在美術資源方面,騰訊AI Lab涉及虛擬人和3D動作生成。據悉,內部團隊正在著手嘗試在動作生成方面得到更真實的遊戲表現,使其適配各類動作、地形和突發情況。

機遇與挑戰並存

看似變革性體驗背後,其實需要耗費大量成本。

一位兼具遊戲跟AI背景的資深人士告訴筆者,AI的確可以有效提升遊戲體驗。掣肘在於,樣本大、訓練成本高。

像《王者榮耀》這類大DAU,高流水競技性產品,固然可以一試。對於中型體量產品而言,往往不太划算。

一位創業遊戲公司高層說,小樣本模型效果不錯的話,拿幾千萬嘗試也不是沒有可能。換言之,大樣本模型,讓企業望而卻步。

眼下業界常討論AGI(通用人工智慧),可產品靈活性仍是一大難題。

DeepMind遇到成本、靈活性困境,無疑最具代表性。

遊戲AI三大難:樣本大、成本高、靈活性差

據估算,AlphaGo整體訓練成本高達3500萬美元,消耗能量足以支援12760個人類大腦在三天內不眠不休地工作。

在備受關注的《星際爭霸》專案上,DeepMind也遭遇了類似難題。

2019年2月28日凌晨,DeepMind旗下游戲AI AlphaStar,以5比0大比分,擊敗了世界上最強大的職業星際爭霸玩家之一。當時它被視為突破人類智力的最後陣地。

通常情況下,訓練AlphaStar需要使用Google v3 TPU,用以支撐數千個《星際爭霸II》協同執行。

AlphaStar共對戰14天,每個代理使用16個TPU。在培訓期間,每個智慧體都經歷了長達200年的實時遊戲。

粗略估算下來,訓練成本達到數百萬美元。拋開成本不談,AlphaStar靈活性亦備受質疑。

紐約大學心理學系教授Gary F. Marcus認為,上述方案限制重重。在單一地圖上使用同一“種族”進行對戰時,其成績確實優於人類。

不過一旦在其它地圖使用不同“種族”時,表現就要差很多。要想切換操作風格,必須得從頭開始重新訓練AlphaStar。

簡言之,即系統缺乏足夠的靈活性。這一特性會讓DeepMind訓練成本迅速放大。

資料不會說謊。根據去年年底DeepMind向英國公司註冊局備案提交的最新財務報告。

報告顯示,近三年DeepMind虧損額分別為4.77億英鎊(2019);4.702億英鎊 (2018);3.02億英礡(2017)。

營收方面,2019年DeepMind收入達2.66億英鎊;2018年達到1.03億英鎊;2017年營收為5442萬英鎊。

綜合近三年業績表現,不難發現DeepMind營收確係穩步增長,虧損敞口逐步收小。不過需要指出的是,DeepMind大部分客戶依賴於母公司Alphabet旗下關聯公司。

某種程度上,這也說明DeepMind商業化還有非常高的提升空間。AI龍頭企業尚且如此,國內AI遊戲廠商估計也大差不差。

只有有效解決樣本、成本、靈活性等問題,AI遊戲才會真正大爆發。


來源:競核
原文:https://mp.weixin.qq.com/s/CGdnB6-jmWpnTchsuWYjCg

相關文章