我們和網易互娛AI Lab的小夥伴聊了聊,AI如何賦能遊戲

李小歪發表於2021-01-14
我們和網易互娛AI Lab的小夥伴聊了聊,AI如何賦能遊戲
圖源:ledgerinsights

這幾年,不管高屋建瓴的學術圈,還是產業前線的網際網路,各路機構和大廠都在下場做AI,就發展程度而言,AI已經是全面滲透的姿態了。

我持續關注AI發展趨勢和使用場景有一段時間了。這幾年,自動駕駛、人臉識別、腦機介面,越來越花裡胡哨的詞兒都或多或少地和AI開始沾邊。

這直接引發了大眾領域內的觀點站隊。保守派大喊著「機器擁有自己的思想很可怕」,技術極客大多是「我們要擁抱AI」的開放姿態,但問題是,AI到底能用在哪些領域,怎麼用,只有內行人清楚。

以目前的發展階段來看,AI技術對人類的助益遠遠大過擔憂。更何況,萬事沒有絕對的非黑即白,AI這事兒也不是一句兩句能說清楚的。我們爭論這些,不如看一看技術目前已經落下的場景,能給產業帶來的實際賦能在哪裡。

我會從大家比較熟悉的遊戲等泛文娛領域展開講講。

為什麼突破點在AI


說一個觀點。

我認為遊戲行業競爭的下一個突破點,可能在於各家的AI技術水平。

來看一個整體脈絡。

根據中國音數協遊戲工委最新的遊戲產業報告,整個行業的規模肯定在擴大,但從2017年-2020年報告也能看出另一個趨勢:隨著人口紅利見頂,使用者規模增長放緩,遊戲市場擴張的同時,競爭也越發激烈。

這種激烈競爭在2018年版號收窄之後更加明顯,監管層面也希望通過數量的減少去促成質量的提升和品質的創新。這背後,是大量未被滿足的遊戲玩家的需求。

伽馬資料等多方報告指出,遊戲感受、玩法創新和社交是大多玩家最注重的遊戲體驗,再往下拆分就是畫面、音樂、公平性、競技感、遊戲協作等具體層面的需求。而諸如AI等技術層面的突破,無疑會改善玩家的這些體驗,加速遊戲行業的換擋升級。

從玩家角度來說,豐富的競技感是重要因素。Steam上線《全境封鎖》時,不同風格的NPC就點燃了玩家。膽小的NPC見了你知道繞路,膽大的就開始猛攻,這就是新型AI利用強化學習技術優化出來的多樣玩法。它更接近一個真實的遊戲環境,體驗更類似你遭遇到風格不同的三維世界玩家。

競技感之外,相對公平有序的遊戲環境也是需要的,多少FPS玩家內心的痛就在於,眼睜睜地看著對手外掛還無能能力。早年CS反恐精英不知道傷了多少人的心。這一點如今的AI技術其實能較好地消化解決,多重維度的匹配和反外掛監測已經在路上了。

繼續深入討論,如果你開啟一款遊戲,第一眼看到的畫面、聽到的聲音也是決定你是否會成為潛在玩家的理由。音畫已經成為絕對不能忽視的因素。

這是AI技術能夠大顯身手的地方,在遊戲設計和開發中,AI的降本增效效果明顯。

舉個例子。對遊戲裡的美術同學來說,通過各種形式的生成-對抗網路模型,AI能直接生成高質量的角色原畫、場景原畫,甚至三維動作資源。作為製作者,美術同學大概最明白AI減少了多少工作量,還提升了畫面質量,增加了玩家沉浸感。

產學研一體,全鏈路賦能


瞭解了AI對於遊戲行業的破局程度,自然也能理解深入遊戲領域的公司們對AI的重視了。

就拿網易來說,其互動娛樂事業群早在2017年就成立了網易互娛AI Lab,收攏的人才基本上都來自於清北浙復交等名校。

一個比較明顯的趨勢是,如今巨頭們入局AI,產學研三者有了更深層的滲透。這也是網際網路行業的妙處,它們本身走在前沿,對科技邊緣的擴充也跑得最快。

以網易互娛AI Lab為例,這幾年,七十多位演算法和工程人員在頂會上發表了多篇重磅論文。

還是從大家比較好理解的音畫這個角度舉個例子,比如去年7月網易互娛AI Lab 獲得全球最大的語音會議 INTERSPEECH 2020 聲紋識別賽道雙料第一。在這次比賽中,網易互娛AI Lab提出了一種 ASR-free 的文字相關聲紋識別演算法。相比傳統的識別方法,該演算法不需要依賴語音識別, 也能在多語言環境下,同時完成說話人和文字內容的驗證。

而聲紋識別技術在遊戲中,主要可用於進行遊戲身份驗證或完善使用者畫像等方面。從實用場景來說,以往該技術多用於安防場景,網易互娛 AI Lab 能夠將其嵌入遊戲場景,本身就是突破。

實際上,更多AI技術的落地是圍繞遊戲的運營痛點來打通的。這就促成AI技術在遊戲生命週期的全鏈路上的貫通和覆蓋。目前,在包括策劃、動作、美術、音訊、程式、測試、營銷和運營的環節,網易的AI技術正在全面賦能。

讓子彈先飛會兒


一個共同的走向是,巨頭們在AI上的發力並不是僅僅為了遊戲,而是不斷思考更廣泛實用的商業場景,以及遊戲業務可能與之產生的化學反應。

這幾年大眾觸點較多的AI使用場景就是自動駕駛,在實際的場景測試裡,自動駕駛公司很難創造或者遇到極限場景,比如暴雨+冰雹的複雜路況,或者高速公路上闖入的動物及行人這種突發事件。這往往會造成測試資料的侷限。

然而在遊戲世界,利用AI技術的測試資料獲取成本就相對較低。而模擬場景中的無限撞車,或持續過彎,都能在AI的短時多次測試中得到一個相對可行的解決路徑。

在賽博朋克的時代,AI技術在產業端的落地只是時間早晚問題,技術深度是目前要突破的方向。先前我提到的來自大眾認知層面最大的爭議點,實際在AI是否能取代人上。

在科學技術螺旋上升的前期階段,這種討論其實會牽絆住前進的步伐,不如讓子彈飛一會兒,看以後的發展,道德倫理與法律法規必然是伴隨技術的進步隨之發展的。

我這裡倒是會用網易互娛AI Lab虛擬偶像製作的相關技術來解釋一下我自己的觀點,為什麼我會認為目前AI之益遠大於弊。

2021年跨年之際,數字人「萬一」登上了浙江衛視的跨年晚會,其生動的面部表情是由網易互娛AI Lab的AIxFace面部動捕技術打造的。這種配置首先就為具備即時性、現場感的直播晚會增強了科技感,其次虛擬人的神態高度真人化也讓互動更為有趣。

依靠AIxFace面部動捕技術,女孩的眼神、脣動、眉毛、甚至法令紋等變化都細緻入微,在交談和說話時,她發出的每一個字也能精準匹配口型。

而網易互娛AI Lab開發的這種輕量級面部動捕系統,與傳統面部動捕技術的最大區別在於,不需要複雜專業的動作捕捉場地和裝置,也不需要設定任何面部標記點,只需要一個單目攝像頭,就可以實時將演員的面部表情遷移到可以臉上,並實現舌頭、視線、口型等表情細節變化的精準跟蹤。

表情的豐富、自然和準確程度,自然是數字人在互動真實感上的直接體現。此外,虛擬偶像是否像真人偶像那樣兼具唱跳能力,也是評判其真實感的重要標準之一。

在此之前,AxFace技術已經在《第五人格》Bilibili禿禿杯遊戲決賽的偵探主播中落地,即時的互動、極具情緒感染力,讓虛擬偶像掙脫了虛擬的限制,真正實現了「次元壁的突破」。

事實上,遊戲AI和非遊戲AI的技術核心是一致的,只是資料、應用場景和優化目標不同。兩者的互相賦能、協同發展是一致的。

在未來,人類和遊戲的互動會呈現愈加多元化的趨勢。可以遇見的是,未來的人機互動並不是一個單一的技術驅動,而會是一個綜合方案,它或許能夠讓電腦像真人一樣通過眼球追蹤、語音分析和肢體語言去理解玩家的意圖。

當然,這不止取決於AI技術的進步,也取決於遊戲裝置和遊戲產品本身的演進。而這兩者,會更深刻地豐富人類的遊戲體驗和快樂感受。



以下是吳懟懟工作室與網易互娛AI Lab的獨家對話內容節選,對話內容有刪減。

1、網易互娛AI Lab目前的規模和人員如何?研究重點和方向是什麼?
網易互娛AI Lab:我們在杭州、廣州和上海三地總共有七十多位演算法和工程人員,從降低遊戲開發成本、提升遊戲開發效率、降低遊戲獲客成本、提升遊戲使用者留存、改善玩家遊戲體驗等方面入手,重點圍繞計算機圖形學中的AI、語音技術,自然語言處理、影像處理和強化學習等技術方向開展工作。目前部分技術已應用於《夢幻西遊》、《一夢江湖》和《第五人格》等多款熱門遊戲。

2、除了AI對話、智慧捏臉、智慧蒙皮等比較前沿的技術外,還會看好哪些AI技術在遊戲中的落地?
網易互娛AI Lab:從目前的技術落地和上線情況可以看到,自動化內容生產相關的技術(如我們的AIxFace面部動捕、AIxPose視訊動捕、AIxDance音樂舞蹈合成和語音合成等技術)、精細化運營相關的技術(AI使用者智慧標籤匹配),和為了提升使用者體驗的強化學習等AI技術在遊戲中落地價值更大,也更加受到遊戲工作室重視。

隨著玩家對遊戲品質的逐漸提升,遊戲的製作成本上升明顯,為了降低和控制成本,自動化生產工具越來越重要。其中角色的面部模型、面部動畫和身體動畫的製作成本比重最大。為此網易互娛AI Lab開發了針對面部動畫自動化生產的AIxFace面部動捕技術方案,和針對身體動畫的AIxPose視訊動捕技術方案以及AIxDance音樂舞蹈合成技術。

3、之前AI週期已經覆蓋到整個遊戲週期的全鏈路,具體覆蓋哪些環節,具體如何實現?
網易互娛AI Lab:在策劃上,AI能夠豐富玩法。例如,AI捏臉讓玩家在捏臉環節能夠擁有更多自由度,輕鬆創造千人千面的遊戲世界;藉助文字生成,遊戲可以在新春等節日推出符合傳統文化習俗的對聯玩法;藉助面部動捕技術,遊戲可以新增顏藝系統,玩家能在遊戲中DIY角色表情包。另一方面,其也作為生產效率工具,幫助策劃自動完成一些傳統需要人手動做的重複性工作,比如音遊中的譜面生成,或者關卡配置中的平衡性驗證。

除了畫面,在音訊上,AI音訊管理系統將海量音訊視覺化呈現,做到自動識別並推薦聲音。語音合成技術可用於遊戲前期語音資源的生成及輔助除錯。藉助音色遷移,當遊戲中某些角色語音臺詞需要變動時,無需同個聲優再次配音,加快音訊迭代速度。

遊戲開發出來之後,就是測試環節。AI自動化測試可以實現測試人力的解放,提升遊戲平衡性,給玩家更好體驗。AI一小時的戰鬥數量是和投入的伺服器資源以及遊戲型別相關的,比如我們現在正在製作的卡牌遊戲,單組伺服器的取樣速度為14w局/小時,相當於一個真人日夜不休地測試約500天。

在後續運營層面,AI可以幫助實現精細化運營。通過AI使用者標籤匹配,玩家能夠匹配到與自身實力相當的對手、獲得更符合需求的推薦;通過AIxGuardian遊戲環境淨化系統,無需大量人力稽核就能夠建立更加友好清潔的遊戲環境,保障玩家的遊戲體驗。

4、我們也注意到營銷環節有一些UGC內容的產出和實現?
網易互娛AI Lab:是的,在營銷環節AI能夠加速創意內容生成,同時也可以幫助實現更多維度的互動玩法。例如,通過AIxDance音樂生成舞蹈動作等技術,角色NPC可以快速生成貼合短視訊平臺熱點的舞蹈動作;時下熱門的H5換臉、聲音互動、文字生成玩法等也都可藉助AI得以實現。

5、網易的遊戲畫面精細程度一直蠻受認可的,尤其是動畫。AI在這塊可以有什麼賦能?
網易互娛AI Lab:AI能夠提升動畫的製作效率,幫助實現美術減負。已經提過的,傳統動捕流程或手K生成的表情或動作動畫,如今通過AIxFace輕量級面部動捕和AIxPose視訊動捕技術,無需寬敞的空間或專業技術人員,只需要一個普通攝像頭就幾乎可以做到表情動作動畫的實時生成,而耗時耗力的NPC建模過程也可以通過3D人頭重建或風格化模型生成得以改變,只需一張照片,AI就可以實時生成超寫實的3D人頭或符合遊戲風格的臉模。

比如在PGC場景下,美術可以基於需求對AIxPose的結果進行和傳統美術生產流程一樣的調整,但相比按傳統流程,動畫製作效率可以提升4-5倍,節省7-8成的成本。

6、目前在遊戲中已經成熟使用的AI技術,如果拓寬到非遊戲的實用領域,還有哪些商業化場景?
網易互娛AI Lab:就拿遊戲AI中的計算機圖形學技術來說,它也可以應用於文娛、會展、教育、金融等各領域。像前面提到的面部動捕技術、視訊動捕技術和其他虛擬偶像製作相關的技術,它和會展中的虛擬導航員、線上教育中的卡通老師形象、金融領域的虛擬客服角色等背後的技術本質其實差別不大。

而遊戲AI中的語音識別、語音控制、語音合成等技術,也可用於搜尋、導航、教育/英語口語的自動評分,以及文娛、會展等領域的智慧互動場景。

遊戲AI中使用的視覺技術也可以應用於其他非遊戲領域,如在遊戲中為防沉迷開發的人臉識別技術,和為淨化遊戲環境開發的政治、色情和暴力監控技術,應用至其他領域分別可以是安防領域的人臉識別,以及電商平臺的政治、色情和暴力監控等。

7、之前葉明江也提過,「AI在遊戲領域最著名的事件就是在遊戲中擊敗人類職業玩家」,像這個AlphaGo打敗人類的事件有意義嗎?有一種觀點是,遊戲就應該為人類創造美好的體驗,如果AI都贏過了人類,那我們還玩遊戲幹嘛呢?對這個觀點怎麼看?
網易互娛AI Lab:AlphaGo的實現對於遊戲,特別是遊戲AI的發展有重要意義。首先AlphaGo的實現讓遊戲公司/遊戲工作室認識到AI可以達到人類頂級水平,可以做到很多以前不敢考慮的事情。

在AlphaGo事件後,遊戲公司給與了AI更大的投入和耐心,同時也開始在各遊戲環節考慮引入AI技術。

其次,AlphaGo的成功給AI研發者注入了一支強心劑,有更多的AI研究者會投入到遊戲AI領域。

最後,我們相信AlphaGo的技術不僅僅可以用於遊戲,未來可以用於很多其他的領域,比如智慧機器人,技術的進步總能帶來新的生產力。

遊戲AI的目的是為人類創造更好的遊戲體驗,這是遊戲AI不變的追求。我們認為AI贏過玩家不會阻礙,反而會激發玩家更大的興趣。

首先,一個競技感不強的AI缺乏挑戰性,難以讓玩家體驗到遊戲的樂趣。更高段位的“玩家”對抗,是激發玩家興趣的一個重要因素。好的遊戲AI可以成為不同水平玩家的對手。

其次,能做出職業選手水平的AI,讓陪玩型AI的實現也更簡單。我們可以用很多種不同的方式去降低AI的強度,創造出低強度但是多樣性的陪玩AI,從而通過更好的冷啟動、玩家陪玩、智慧輔助等方式提升玩家遊戲體驗。

最後,AI可以發現/探索出一些頂尖玩家也未發現的操作和玩法,成為職業選手們的輔助或者陪練。

作者:李小歪
來源:介面
地址:https://www.jiemian.com/article/5537551.html

相關文章