這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

遊資網發表於2021-04-19
這段時間,Metaverse(元宇宙)在科技和遊戲行業等領域可謂熱門。MetaApp、Rec Room、Manticore Games相繼拿到了1億美金的融資,連英偉達也在GTC2021上宣佈他們打造了一個雲原生平臺NVIDIA Omniverse,黃仁勳表示“Omniverse 旨在建立共享虛擬 3D 世界,就像尼爾·斯蒂芬森在 1990 年代早期的小說《雪崩》中所描述的科幻虛擬空間那樣。”

rct studio 亦是擁抱Metaverse中的一員,他們的願景是基於人工智慧技術打造下一代互動娛樂體驗,在使用者端和生產端帶來全新的使用者體驗和工作流程。他們相信 Metaverse 是網際網路的未來,下一代的娛樂體驗將會更加開放、沉浸與智慧,人類與虛擬世界的互動將變得更加動態和多元。在這個始終線上的數字世界中,每個人都可以成為自己故事中的主角。

為了實現這一願景,rct 將前沿的技術,特別是深度學習和強化學習,引入娛樂產業。他們打造了一系列的 AI 解決方案,在不同型別的多個場景中實時生成動態且個性化的互動式數字內容,幫助開發者和創作者打造真正動態、智慧的虛擬世界。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

近日,GameRes採訪了rct studio分享他們的成立願景、目前旗下的重點產品混沌球(chaos box)以及他們對Metaverse這一領域見解。據瞭解,rct studio目前接近30人,今年工作計劃的主要是為遊戲企業和開發者提供一系列的AI解決方案為主。同時正在開發幾款小遊戲,之後會逐漸釋出出來。以下分享由rct講述:


混沌球(chaos box):深度強化學習的AI敘事引擎

直切主題,首先介紹我們目前的商業化產品——混沌球(Chaos Box),一個基於深度強化學習的AI敘事引擎。

首先,從AI行業角度來說,其實我們可以看到目前關於AI的商業化以及落地方面,視覺影像處理是比較主流且熱門的一個方向。這主要是因為視覺影像對於我們人類資訊加工處理的重要性,我們自出生後可能需要學習的第一個的技能就是識別面孔,然後識別周圍的物體,並賦予它們意義。

並且我們大腦處理和分析的大部分資料都是視覺化的,處理影像資訊的速度要遠遠大於文字資訊。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

然而影像與影像之間的資訊不一定是獨立的,可能是存在邏輯關聯的。例如,我們的視覺可以對一個桌子上所有的物體進行資訊處理,但是這個桌子是誰搬來的,上面的物體又是誰放的,這部分的資訊和目前眼前呈現的資訊是存在邏輯關係的。正是背後的邏輯體系,讓我們能以合理的方式,處理並理解我們所獲得資訊。

所以從這個角度來說,我們認為從邏輯端出發,可能能夠幫助人類更進一步地呈現更多且豐富的資訊,同時也是幫助人類更多地瞭解自己。

與此同時,技術的不斷進步讓我們與數字資訊發生越來越高頻、深度、沉浸與多樣的互動,從文字、音訊、影像、長短視訊再到遊戲,我們會發現,遊戲化的數字內容是當前階段數字內容整合度很高且使用者能夠發生互動行為最沉浸的媒介和形式。因此在通往Metaverse之路上,我們選擇了遊戲作為起點,並再次基礎上去探索與創造實現Metaverse的路徑。

我們認為,未來的數字娛樂內容的是像頭號玩家或者西部世界那樣具備極強的動態且個性化的互動式體驗。在這個世界,你可以和具有各種不同性格特點的原生虛擬物種們建立情感連線、訴說自己的心情、分享自己的故事、表達自己的不滿、感嘆人生的無常。他們也會像真人一樣傾聽你的故事,或是表達自己的想法,或是分析他知道的一些祕密,或是參與到你對人生的討論中。

而這一切的發生需要為虛擬生物們提供一個具備智慧決策能力的“大腦”,因此我們打造了核心技術:混沌球(Chaos Box)演算法,這是一個居於深度強化學習的AI敘事引擎,可以用來分析使用者的實時互動輸入並動態地生存虛擬角色的互動反應與故事情節。

在不需要任何指令碼的情況下,混沌球(Chaos Box)不僅能控制遊戲中虛擬角色的行為邏輯,讓其自發地產生非常智慧的行為。也能讓虛擬角色們能夠探索每一種真實存在的可能性,從而自主地實現一種全新且真正智慧的遊戲體驗。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

至於混沌球是如何作用在遊戲開發中,首先介紹一下混沌球的原理。參考數字娛樂內容行業中的場景化創作的手法,我們把整個互動式數字娛樂體驗的整體流程切片為一個一個的場景,每個場景需要確定的輸入和輸出,同時給出對應的設定。

場景之內的環境是封閉的,除了輸入和輸出之外,在進行過程中不與外界發生互動。我們可以用一張圖來表示傳統的敘事方式和基於混沌球的敘事方式的不同:

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

可以看到,傳統的敘事,無論是單分支的敘事,還是現在幾乎所有的所謂“互動式電影”裡的多分支“互動式敘事”,都仍然是基於“事件”作為敘事的基本單元,也就是什麼事情發生了,然後什麼事情發生了。

無非是讓使用者可以自由地從給定的兩到三個選項中,選擇不同的接下來會發生的事件,整個敘事仍然是基於預先定義的路徑來往前推進的。

而混沌球的不同點在於,我們將“事件”替換為一個又一個明確定義了入口和出口的黑盒。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

你可以簡單理解為,在每一個切片的混沌球裡,開始和結局(一個或者多個)是確定的,但是玩家每一次如何從開始到達結局,則是混沌的,是路徑不明確的。

這個路徑只有當玩家不斷地和虛擬世界裡的虛擬人物 NPC 作出互動,這些 NPC 根據深度強化學習訓練後的模型作出動態且實時的反應來推動劇情發展之後,才會不斷地坍縮,直到最終被確定下來。

這也是我們為什麼命名為混沌球演算法的原因。因此,做到真正的互動式敘事的關鍵,在於將敘事的中心,從故事本身,轉移到故事裡的所有可能參與者身上,由所有可能參與者的邏輯來共同推動和串聯不同的劇情可能性。

在某個場景中,具體的物件包含了人物(玩家和 NPC)和環境裡可以被互動的物體。人物有性格、狀態、動作集,物體有物理設定(包括方位、大小、形狀、顏色等等)、狀態、以及支援的動作。

人物擁有狀態和設定之後,就對可行的動作集產生影響,比如一個膽小的 NPC,與其他人發生衝突的概率就會很低。有了輸入、設定和停機條件之後,就可以利用模擬環境和深度強化學習模型對每個人物(包括玩家和 NPC)在此封閉場景下的行為策略進行探索,學習出合理的、符合目標策略的決策模型。

同時,在某一個場景下探索出來的策略(包括人物和物體的策略集),還可以被拆解和整合,在後續的場景中,可以重複使用這樣的策略並進化。

這個整體架構的核心就是場景的設定,我們把這個場景設定叫做混沌球結構。⼀個混沌球就是⼀個具體的遊戲場景中的最⼩邏輯單元,定義了在場景中的⻆⾊與此場景下⻆⾊的⾏為邏輯。

基於這樣的設計,混沌球(Chaos Box)能在遊戲和虛擬世界的體驗中,實現更加動態且個性化的劇情探索。開發者們只要基於主故事線和引數來自定義設定引數,就能自動地生成無限的故事分支,從而獲得無盡的變化,因為任意的兩個故事和路徑都是不同的。在操作體驗上,遊戲會包含更廣泛的玩家輸入,不會再有下拉選單,而是以無縫方式的體驗並推進劇情發展。

同時,混沌球(Chaos Box)也能在遊戲內大規模地生成具有不同行為模式和臺詞對話的智慧 NPC,智慧生物體以及智慧環境。在強化學習等技術的支援下,混沌球(Chaos Box)演算法能動態地生成虛擬生物的對話和互動,開發者們只需要對引數進行細微調整,就可以快速創造多個角色。這些虛擬生物會更加智慧和聰明,玩家也會獲得更真實刺激的角色扮演體驗。

除此之外,混沌球(Chaos Box)同樣能生成以對抗和陪玩等角色出現的虛擬生物,為他們提供動態且智慧的行為模式。這些AI驅動的虛擬生物,會基於不同玩家進行自我進化,同時創造更豐富、更個性化的體驗。更重要的是,通過設定不同的引數,混沌球(Chaos Box)可以同時支援大量且個性化十足的虛擬角色,參與到玩家體驗虛擬世界的每一個環節中。

在傳統的遊戲生產流程中,人們需要通過決策樹和狀態機技術,針對性地為每一個事件中的物件、行為和結果進行明確的定義與設計,才能在一定程度上實現內容的多樣性與複雜性。

為了更好的吸引玩家,遊戲需要不斷地更新內容。如果人們希望在現有的決策樹基礎上增加新的物品、互動方式、事件情況等,就得對所有相關的決策樹進行修改和調整。

然而,開發者花費了非常多的人力和時間才打造出來的少量內容,使用者會在短時間內以非常驚人的速度將其消耗完畢。

與決策樹不同的是,混沌球(Chaos Box)為遊戲中的內容提供了能夠自主決策的 “大腦”,智慧地生成和控制遊戲內容本身以及和玩家的互動邏輯。在簡單的規則和設定下,遊戲開發者就可以快速地生成動態且個性化的劇情和事件、能夠與玩家進行智慧對話和行為互動的 NPC 等數字內容。

當開發者使用混沌球(Chaos Box)開發遊戲時,只需要在簡單的規則和設定下,就可以快速地生成動態且個性化的劇情和事件、以及能夠與玩家進行智慧對話和行為互動的虛擬角色。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

與此同時,混沌球(Chaos Box)能夠與傳統的決策樹進行任意的結合。

遊戲開發者可以選擇將已有決策樹的某些節點替換成一個個的混沌球,在區域性場景中打造無限的內容互動可能;或者也可以使用混沌球覆蓋所有的遊戲場景,從而製作完全開放且自動生成的動態內容。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

為了讓內容創意者和開發者能更以簡單且高效的方式使用混沌球(Chaos Box)智慧生成動態的數字內容,我們將混沌球(Chaos Box)整合到了一個雲原生的平臺:夢境雲(Morpheus Cloud)

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

夢境雲(Morpheus Cloud)是基於混沌球(Chaos Box)演算法打造的雲原生服務。當遊戲接入了混沌球演算法後,夢境雲(Morpheus Cloud)能在玩家與遊戲內容進行互動的過程中,實時生成智慧的動態內容。

玩家和遊戲的互動方式包括但不限於文字、語音以及所有在遊戲裡允許發生的互動行為,根據這些不同的互動,遊戲內所有虛擬⻆色、生物以及環境內的物體,都可以實時地生成不同的內容。

當遊戲開發者使用夢境雲(Morpheus Cloud)進行開發時,僅需要在某個場景中,對玩家能夠互動的物件進行非常簡單的設定,比如角色、物體、行為等,並將所有的互動關係明確,即可在混沌球(Chaos Box)演算法的幫助下進行訓練,從而該場景中實現動態且個性化的劇情、智慧 NPC 等互動內容。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

事實上,前沿的遊戲技術為行業帶來了全新的可能性,夢境雲(Morpheus Cloud)和AI能幫助我們實現更多之前無法實現的效果和體驗。

那這個敘事引擎能為開發者帶來哪些幫助呢?從最直接的體驗來說,我們能夠為開發者帶來的好處主要體現在兩個方面:提高開發效率和創造新體驗。

在《荒野大鏢客2》(Red Dead Redemption 2 )之類的遊戲中,每一個 NPC 都至少有 80 多頁的指令碼。這主要的工作都是靠人類“手工”完成的,這一切的工作無非是為了讓玩家在那個遊戲世界當中,感受到 NPC 的真實性。而為了保證這樣的真實性,遊戲廠商就需要花費大量的人力和時間成本。混沌球(Chaos Box)技術能夠在不需要任何指令碼的情況下,控制遊戲中虛擬角色的行為邏輯,並讓其自發地產生非常智慧的行為。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!
傳統制作流程 vs 混沌球製作流程

在傳統的遊戲生產流程中,人們需要通過決策樹和狀態機技術,針對性地為每一個事件中的物件、行為和結果進行明確的定義與設計,才能在一定程度上實現內容的多樣性與複雜性。而為了更好的吸引玩家,遊戲需要不斷地更新內容。

如果人們希望在現有的決策樹基礎上增加新的物品、互動方式、事件情況等,就得對所有相關的決策樹進行修改和調整。然而,開發者花費了非常多的人力和時間才打造出來的少量內容,使用者會在短時間內以非常驚人的速度將其消耗完畢。比如,在Red Dead Redemption 2 中,玩家可能去一個酒吧轉了一圈就出來了,這也就意味著關於酒吧這個場景內的遊戲內容就被玩家消耗掉了。

可以說,隨著不斷的迭代和發展,混沌球(Chaos Box)技術是真正能實現《龍與地下城》(Dungeons & Dragons)那種玩家可以進行自由的互動、探索和體驗個性化的劇情體驗。另外,當混沌球(Chaos Box)技術結合推薦演算法,這也為當前的遊戲玩法進行了進一步的創新,這種以個性化和湧現式為代表的玩法,在為每一個玩家提供千人千面的內容體驗的同時,也能更好地激發玩家在虛擬世界中進行探索和創造的新需求,從而帶來新的遊戲體驗。

實踐案例:“盜夢人”技術demo

我們基於混沌球技術做了一個技術demo “盜夢人”,這個專案我們大概開發了一個月,自由互動與動態且個性化的劇情是它的主要特徵。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

Demo展示:https://www.jianguoyun.com/p/Dd-VwJwQivLFCBiliq4D

在這個“盜夢人”裡,玩家扮演的角色會與其它四個NPC互動。而在這四個NPC的背後,我們沒有提前設定任何的指令碼和行為樹,他們完全是由我們的AI模型驅動的。我們僅僅是對這個場景中的物體、角色性格和被允許發生的行為做出了具體的描述和定義,然後通過強化學習引擎和模擬引擎的訓練與模擬,就在該場景設計了背後的“大腦”。

當玩家和該場景中的任意物體和角色進行互動時,這個“大腦”就會根據玩家的操作,實時地控制場景內角色的行為和與物體發生具有性格特點的動作互動。

我們可以看到,玩家的互動輸入包括:語言、文字,還有各種行為方式,這些輸入狀態可以動態且智慧地被這些NPC進行處理和決策,從而這些NPC能夠在實時地生成一定的故事劇情。

實際上我們的這個技術是把敘事的中心轉移到每一個NPC自己的身上,基於這個技術我們其實對傳統的敘事帶來了非常顛覆性的改變。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

而想要NPC在遊戲中實現“真實性”演繹,我們的答案是基於遊戲資料的應用。

首先,遊戲中的“真實性”與“互動性”都是非常重要的核心。真實性是玩家在一個虛擬世界裡主觀構建出來的,它的本質是在於遊戲內和玩家陪伴的、玩家操控的、或者是與玩家對抗的這些角色的行為的動態豐富程度。而“互動性”是玩家是在遊戲過程中所體驗到的,比如說在很多的逃殺類遊戲裡,和鋼槍流相比起來,很多年輕玩家更喜歡通過語音或文字相互交流,進行互動,也比如說在很多 SLG 遊戲裡,很多玩家追尋的其實是和卡片裡的人物角色之間的養成關係,和另外一部分對戰鬥狂熱的核心玩家相比,這些玩家對戰鬥沒有強烈的慾望,而更看重和角色之間的互動和情感連線。

所以我們可以看到,當我們在強調通過更細維度的使用者行為資料(In-Game Data)來生成遊戲內的更個性化的體驗的時候,這裡的“個性化”和“真實性”其實並不是衝突的,相反,這兩者都在強調一個核心,那就是讓玩家體驗到此刻他最想體驗到的內容,看到最能夠吸引他的情感和衝動的反饋。

例如,在二次元遊戲或者模擬經營類的遊戲裡,玩家和虛擬角色之間的情感互動主要通過基於文字的對話來實現和維繫。傳統的技術下,策劃需要消耗大量的時間和精力來生產這些對話內容,而且這些內容在使用者互動的過程中也只能以一個靜態的方式呈現給使用者,即使用者只會在可能性極其有限的分支裡去獲得一種內容體驗。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

隨著自然語言文字生成技術的進步,更大規模的語言模型讓更加動態的對話樹和對話內容的自動生成逐漸變得可能。比如,在特定場景的對話中,人物在受到場景狀態和條件的約束下,可以從極少的語料裡,生成大量表達方式各不相同的臺詞文字,也可以根據狀態的不同自行調整表達方式,而人物的對話樹也可以由預先訓練好的語言模型自行進行發散,生成出幾十甚至幾百層、每個節點都能延伸出多個子分支的對話樹。

這對於傳統的工作流程和使用者體驗都是一個極大的提升和改進。除此之外,對話的生成也可以根據玩家的行為偏好來進行自我調整,每一個角色的臺詞都會根據不同玩家不同的性格特徵動態的變化,這些潛在的應用都會極大的提升使用者體驗裡的“互動性”。

再例如,在一些逃殺類、休閒類的遊戲裡,為了維持真人玩家所能獲得的“真實性”,特別是在一些不平衡的遊戲機制裡,運營方必須使用大量的 AI 來填充匹配時所遭遇到的其他玩家。這些不平衡的遊戲機制給匹配提出了更困難的挑戰:玩家遭遇到的對手必須要符合玩家當前的水平,否則不僅無法保證“真實性”,連遊戲給玩家帶來的成就感和好勝心都會被因此而摧毀殆盡。同時,在這樣的遊戲裡,當玩家開始因為“真實性”不足而流失的時候,更多的玩家會因為其他玩家的流失而匹配到 AI,進一步地形成一個大量使用者流失、資料崩盤的惡性迴圈,這也是很多休閒遊戲在持久化運營上遇到的問題。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

然而,更加性格化的 AI 的引入能夠讓玩家在體驗上獲得更優質的、更具有自我迭代能力的“真實性”和“互動性”。不同難度下的 AI 可以具有不同的性格特徵,比如激進的、佛系的、搞怪的等等,且在行為和對話表現出不同性格特徵的同時,可以根據匹配到的真人玩家的行為資料,動態的調整策略以及生成的內容。基於強化學習和推薦演算法的結合來實現個性化的反饋內容,這將是比傳統的大資料方法更加精準,更加智慧的運營方法。

從模擬經營到養成,從休閒到棋牌,從卡牌到 ARPG,從 MMO 到開放世界,幾乎所有的遊戲型別背後都有這樣一個核心的對於長期運營的關鍵要素貫穿其中,那就是提升玩家所感知到的互動性。無論是簡單的基於經驗的資料分析來優化數值和運營策略,還是加入一些對話機器人來實現遊戲內一些功能性的問答,或者是針對不同的玩家群體設計具有不同行為樹的 AI,這些都代表了一個新的時代的開端,一個基於更智慧、更精細化運營的遊戲體驗來和使用者互動的新時代。

當然,實現更真實的遊戲敘事和NPC互動表示,在技術實現上也有諸多難點。

首先是演算法本身的難點。目前為止,強化學習在數字娛樂 AI 領域的應用主要是在智慧體的開發上,它使得我們不需要標記的樣本就能讓智慧體自己在某一個虛擬的世界中自己進行探索與學習。比如,DeepMind 的傲人成績幾乎都是基於數字娛樂內容的,它用 DQN 玩 Atari 遊戲,用 AlphaGo 打敗圍棋高手,而 AlphaZero 甚至能精通圍棋、國際象棋和將棋三大領域。

此外,在數字娛樂內容的設計、生產、分發、運營等多個環節提供價值,比如內容生成、使用者模擬、自動化測試、使用者建模等,強化學習也有著很廣泛的應用,其目的則都是圍繞著如何提升玩家在數字娛樂中的體驗和提高製作過程中的工作效率。

但是在與現實場景更接近的多智慧體(Multi-Agent)多目標(Multi-Objective)環境下,或者換一種更直白的說法,在以劇情或以故事體驗為主的數字娛樂場景下,目前還沒有較為成熟和高效的強化學習框架和解決方案。

這類場景的經典代表作品就是各式各樣的傳統的角色扮演類遊戲 (Role-Playing Games)以及如今越來越成為趨勢的互動式數字娛樂內容。

這類數字娛樂內容裡的智慧體往往更加的多樣和獨立,且每個智慧體的目標不再像競技性場景下那樣明確和易於定義,因此我們稱之為多智慧體多目標的環境。

其次是技術和場景結合中的難點,遊戲有很多型別和玩法,在這背後是多種遊戲機制的結合與協調。在不同的場景中,NPC所扮演的角色和承載的職能也不同,這也讓混沌球技術和傳統決策樹技術結合時,需要根據具體情況進行融合以及引數的調整和優化。

另外,考慮到不同遊戲的開發引擎和技術環境也有差異,我們在將混沌球(Chaos Box)技術和遊戲進行結合的時候,也遇到了非常多的工程問題。雖然有很多不容易解決的點,但我們已經攻克了大部分的問題,逐漸打造了一系列外掛、藉口,也形成了一套技術層面的操作方法論。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

合作案例:與悠米互娛聯手打造《代號:奧德賽》

去年11月份,rct studio宣佈與悠米互娛達成合作,rct將使用混沌球(Chaos Box)技術全面協助悠米互娛共同打造一款3A級賽博朋克開放世界MMO遊戲《代號:奧德賽》。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

為了實現幾乎無限且高度自由的互動可能性,我們通過內嵌自主研發的核心技術混沌球(Chaos Box)的雲原生引擎 Morpheus Cloud,為《代號:奧德賽》打造了不計其數的虛擬角色。這些具有智慧意識的虛擬世界原住民,大量的分佈在遊戲中的每一個角落。他們可以感知整個虛擬世界的狀態與變化,從而使玩家的互動不再受限與固定且重複的對話和選擇。

玩家可以操作自己的虛擬化身,與他們做出任何能被允許發生的行為,享受更加刺激真實的角色扮演體驗。同時,這些虛擬角色也將成為玩家在虛擬世界中的原生好友,玩家在與他們進行非常真實且個性化的互動中,會和他們建立獨特且豐富的情感連線。

這些具有如同真人般情感的虛擬角色,正是由混沌球(Chaos Box)賦予了他們千變萬化的多樣性,從而讓他們在和玩家互動的過程中,實時地給玩家帶來層出不窮的獨特體驗,陪伴玩家探索《代號:奧德賽》裡廣闊無垠的賽博朋克世界,並共同創造屬於玩家自己的劇情、故事和虛擬人生。

混沌球(Chaos Box)也真正實現了讓玩家能夠主動地參與這個世界的改變,從而將《代號:奧德賽》打造成一個真正開放且 “活著的” 虛擬世界。

這家公司已身處Metaverse一環,AI敘事工具為遊戲創作更多可能!

最後,簡單再說下,rct studio致力於使用人工智慧打造下一代互動式娛樂體驗,使命是幫助人類更多地瞭解自己。我們的合作伙伴來自世界各地,他們有著不同的文化和背景,這正是 Metaverse 不可缺少的元素。我們在使用 AI 為全球使用者帶來下一代互動式娛樂體驗的同時,也在與他們共同創造 Metaverse 和屬於每個人自己的故事。

原文:https://mp.weixin.qq.com/s/TTGY9MsUdl4l-eODWiXYuw

相關文章