AI的新風口,能讓我們的遊戲行業起飛麼?

西北偏北發表於2024-03-14
剛到龍年,“AI內容生成”的新訊息,就在遊戲行業掀起了巨大的波瀾。

2024年2月16日,Open AI公佈了文字轉影片大模型SORA,在極短的時間之內,就引起了全球科技媒體廣泛報導,同時在無數內容創作者社群掀起了前所未見的巨浪:

AI的新風口,能讓我們的遊戲行業起飛麼?

如果說2023年的“文字轉圖片”技術早已讓我們審美疲勞,那麼隨著SORA的登場,僅需提示關鍵字就能生成長達60秒的連貫影片,如此離譜的效率,顯然超越了不少流媒體時代Vloger的心理預期,“AI取代人類”的憂慮,一夜之間捲土重來。

事實上,不僅僅是影視行業,就連看似沒有直接關聯的遊戲業,也隨著這一輪的輿論風口,響起了不少爭論的聲音——再聯想到今年年初,似乎有報導表示“Valve放寬了對AI生成內容的管制”,以及有新聞聲稱“Level-5(《妖怪手錶》的製作商)已經在開發過程中引入了AI內容生成技術”,一個十足現實的問題,儼然已經是近在眼前:

“遊戲產業即將迎來AI革命”,究竟是誇誇其談,還是確有其事的客觀事實?

SORA的真面目?

在AI內容生成領域,“文字轉影片”其實並不是什麼前所未見的新概念,諸如Stable Video Diffusion和Pika等專案,已然讓我們見識到了這個產品方向的旺盛潛力——不過即便如此,儘管獨創性並沒有想象中那麼突出,但和同類產品相比,在技術層面,SORA確實不乏後發優勢:

AI的新風口,能讓我們的遊戲行業起飛麼?

首先,在演算法層面,SORA融合了diffusion和transformer兩種架構,生成的影片內容在理論上不再有解析度、時長以及尺寸一類的限制——前提是硬體效能跟得上;

其次,透過對captioner model和prompts擴寫等技術的引入,SORA可以更融洽地關聯提示文字和生成效果,有效提升影片成品的內容質量——之所以SORA僅憑一段60秒時長的演示影片就能聚攏全球科技媒體的目光,“第一印象十足好看”的內容生成效果,顯然正是主因。

不過,倘若就此認定,“SORA已經能夠取代專業動畫乃至影像從業者的工作”,那顯然依舊是為時過早:

AI的新風口,能讓我們的遊戲行業起飛麼?

還是以SORA反響最大的“東京街頭漫步”AI影片為例,儘管單從截圖乃至Gif片段來看,無論光影還是紋理效果都已經達到了近乎亂真的地步,但只要看過完整全片就知道,內容生成AI常見的“肢體扭曲”現象並沒有在這部短片中缺席,甚至還達到了變本加厲的程度:漂浮感十足的步伐僅僅是小問題,行進間雙腿莫名其妙的“交織混淆”、彷彿軟體動物一般扭曲蠕動的奇景,只怕對於大多數人都是過目難忘——再考慮到所有畫面都是AI“取代人工”生成的結果,我們基本可以看到一個明確的階段性結論:

至少在目前這個階段,哪怕是正在風口浪尖的SORA,想要徹底取代創作者的才華與創意,持續迭代進化依舊不可或缺。

至於理由,其實並不複雜:

AI的新風口,能讓我們的遊戲行業起飛麼?

說到底,SORA的基本原理,依舊僅僅是透過樣本影片學習了現實世界規律的“表徵”,達到了“知其然”的程度,在細節上不可能模擬真實世界的物理規律,距離“知其所以然”的擬真化,依舊有不小的差距——換句話來說,儘管有報導聲稱,SORA可以在沒有明確資料標記的前提下,僅憑規模效應“湧現”生成某些超乎預期的畫面,但除了刻意為之追求獵奇噱頭的玩票愛好者,這種帶有鮮明“AI滋味”的動態畫面,恐怕很難在專業化應用領域(包括但不僅限於教育、培訓以及廣告宣傳)發揮預期中的功效。

“好用,但也沒那麼好用”——這種“雷聲大雨點小”的基調,正是目前的內容生成AI在大多數應用領域面臨的窘境;不僅是圖文影片,在遊戲開發領域,AI應用的侷限性,基本如出一轍:

AI應用,不見得高人一等

事實上,哪怕是內容生成AI明確參與制作、擁有可觀人氣反響的熱門作品,只要點開驚世駭俗的標題細看報導內容,十之八九都能找到“不盡如理想化預期”乃至“譭譽參半”的真實反饋:

AI的新風口,能讓我們的遊戲行業起飛麼?

以洛杉磯Corridor Digital工作室出品的《ANIME ROCK, PAPER, SCISSORS》為例,在2023年3月剛剛上線的時候,這部標榜“內容生成AI深度參與制作”的短片,曾經在不少社交媒體產生了巨大的反響——至少在垂直領域,轟動程度絲毫不遜於如今的SORA;但與此同時,許多動畫行業的從業者,不約而同地對這部“作品”流露出了毫不遮掩的厭惡:

AI的新風口,能讓我們的遊戲行業起飛麼?

“一幫懶惰、無恥、對著動畫藝術形式吐口水的小偷!”

這便是動畫版《惡魔城》的導演Samuel Deats,對《ANIME ROCK, PAPER, SCISSORS》及其背後製作團隊留下的點評——正所謂窺一斑而知全貌,動畫領域專業人士的態度,基本如上。

需要強調的是,這並非毫無根據的妒忌乃至“對新生技術的恐懼”——之所以《ANIME ROCK, PAPER, SCISSORS》能夠擺脫“獵奇”的水平進入“能看”的範疇,正片相對統一的畫面風格自然是主因;而這種相對穩定的畫風背後的成因,其實完全沒有半點神秘感可言:

AI的新風口,能讓我們的遊戲行業起飛麼?

在為本片訓練AI時,Corridor Digital選擇了Madhouse出品的經典賽璐珞動畫《吸血鬼獵人D》作為樣本,從而實現了華麗且較為統一的視覺風格——換言之,如果沒有這種近乎以幀為單位進行摹仿的“借鑑”,如果沒有Madhouse在20年前竭盡心力創作出的傳世傑作,《ANIME ROCK, PAPER, SCISSORS》想要從構想化作現實,顯然斷無可能。

AI的新風口,能讓我們的遊戲行業起飛麼?

“儘管對於Corridor Digital 的粉絲來說,《ANIME ROCK, PAPER, SCISSORS》背後的AI技術似乎很有吸引力,但就實質而言,這個團隊利用AI技術進行的‘創作’,是對動畫行業的又一項有害創新——這種偷竊的藝術家創作的行徑,和現實中偷竊藝術品的罪行沒什麼差異。”

——看看Kotaku對《ANIME ROCK, PAPER, SCISSORS》給出的評價,“AI生成內容取代藝術家創作”究竟有幾分屬實,相信大家心中有數。

AI的新風口,能讓我們的遊戲行業起飛麼?

相比於譭譽參半的“創作工具”,把AI生成內容視作“輔助手段”的思路,風評明顯要好得多——實際上,遊戲行業現如今甚囂塵上的“引入AI內容生成技術”,到頭來基本上都能繞回這個原點。

還是以前面提到的Level-5為例,從相關報導的實際內容來看,AI內容生成的實際應用範疇,大致如下:

AI的新風口,能讓我們的遊戲行業起飛麼?

為遊戲新作生成宣傳圖示意草稿,方便開發組從中獲取靈感繪製最終成品圖;

AI的新風口,能讓我們的遊戲行業起飛麼?

利用AI技術運算提升畫面解析度;

AI的新風口,能讓我們的遊戲行業起飛麼?

繪製遊戲背景圖素材,包括建築群落以及人群等等;

除此之外,Level-5對AI的應用還包括合成遊戲角色臨時語音、透過與ChatGPT進行交流來“探討”角色設定的思路靈感,以及利用AI程式設計輔助工具來生成程式碼並完善遊戲描述,從而提高網站建設的效率——總體來說,AI生成內容確實在Level-5的生產力規劃中佔有一席之地,至於實際地位,相信大家有目共睹。

AI的新風口,能讓我們的遊戲行業起飛麼?

至於Valve,儘管在名義上放鬆了對AI生成內容的管制,但在官方Blog推文中,V社明確指出了AI應用的實質範疇:

1.預生成內容:在遊戲開發過程中藉助 AI 工具生成的內容(藝術作品/程式碼/音效等)。在《Steam 分銷協議》中,各位曾向 Valve 承諾自己的遊戲不會包含非法或侵權內容,且遊戲將與營銷材料保持一致。我們在發行前的稽核過程中,將會評估遊戲中的 AI 生成內容,所採取的條件與評估所有非 AI 生成內容完全一致——其中一項便是檢查遊戲是否符合上述承諾。

2.實時生成內容:在遊戲執行過程中藉助 AI 工具生成的內容。除了須遵循與預生成內容一樣的規則外,此類內容還須滿足一項額外條件:在內容調查中,各位需要告知我們你對 AI 技術採取了哪些保護措施,以確保其不會生成非法內容。

Valve表示,以上條目將成為Steam平臺遊戲內容的新稽核專案,相關遊戲資訊將會在Steam商店頁直接公佈,便於玩家瞭解中意的作品是否包含AI生成內容;除此之外,透過Steam平臺啟用的新系統,玩家還可以對遊戲內違法的AI實時生成內容進行舉報,有效避免AI技術的有害濫用。

AI的新風口,能讓我們的遊戲行業起飛麼?

那麼,除了以上這些“配菜”性質的輔助應用,AI內容生成究竟有沒有為遊戲業貢獻實質化生產力的例項?答案當然是肯定的,但效果也是盡在預料之中的:

AI的新風口,能讓我們的遊戲行業起飛麼?

2023年,Nvidia聯手Convai,推出號稱“一站式完成遊戲NPC建立”的AI工具,Omniverse Avatar Cloud Engine——根據官方描述,憑藉這款AI解決方案,遊戲製作者可以不費吹灰之力讓自己遊戲的NPC擁有栩栩如生的動作表演、臺詞對白乃至劇情動畫,儼然是“AI賦能遊戲產業”的傑出表率;

然而,隨著這款“革命性的AI應用”在CES 2024上公佈了可玩演示,所有滿懷期望前去圍觀的媒體和參觀者,不約而同地大失所望:

AI的新風口,能讓我們的遊戲行業起飛麼?

哪怕以最寬容的標準來看,Omniverse Avatar Cloud Engine實際呈現的效果,基本也和標準的AI聊天機器人不相伯仲;平仄不分的語調再加上極不自然的角色動畫,直接讓最終實現的畫面效果成為了在恐怖谷邊沿反覆橫跳的巨大黑色喜劇——不得不說,對於超自然驚悚主題的作品而言,這種詭異感十足的效果還真可謂是相得益彰,至於其它型別,只能說,暫時還是省省吧。

儘管假以時日,憑藉兼顧規模與深度的訓練,Omniverse Avatar Cloud Engine確實有潛力達到盡善盡美的水平,不過,考慮到就在這款工具於2024年正式亮相的兩週前,整個遊戲行業迎來了一波範圍極廣的裁員,究竟還能不能有源源不斷“出自人手”的樣本供AI大模型進行訓練,說實話,真有點耐人尋味。

AI必勝?未必是定論

“內容創作AI是最好的B-Roll創作工具。”

這是Youtube博主Paddy Galloway,對SORA這一波熱潮給出的評論。在某種程度上,將其視作C端使用者和自媒體創作者的真實感受,基本合乎預期。

AI的新風口,能讓我們的遊戲行業起飛麼?

實際上,如果讓我們冷靜下來重新審視這一波“AI崛起”的輿論浪潮,大多數朋友應該不難發現,單從宣傳口徑和造勢力度來看,AI創作內容的這一波聲勢,和近幾年潮起潮落的一系列網紅科技新突破是何其相似——如出一轍的博人眼球宣傳片,照本宣科的“重塑行業”和“改變世界”,至於說潮水褪去後,這些曾經紅極一時的噱頭還能剩下什麼,咱們應該有目共睹。

在篤定“這一波一定能成”準備全副身家All In之前,稍退半步從全域性層面把整個專案重新審視一番,未必不是個好主意——區塊鏈如此,元宇宙如此,AI生成內容,同樣也是如此。


原文:https://mp.weixin.qq.com/s/EYwDXTWYaSs7GKIoq9e-dQ

相關文章