大AI時代即將到來?AI技術能解放多少技術力

丸子發表於2023-04-06
如果要盤點今年網際網路科技板塊的第一話題,那麼AI技術是當仁不讓的第一。

最開始人們都在爭論關於AI作圖的那些議題。從幾個月前,AI作畫只有幾個模版來回變化,不會畫手,甚至不會畫拿筷子吃麵的尷尬;但現在,已經可以個性化畫風深度定製,寫實的、3D化的、二次元的畫風應有盡有,甚至還能針對各種個性化畫風做出深度學習,完美復原,僅是幾月發展就與當初不可同日而語。

大AI時代即將到來?AI技術能解放多少技術力
曾經讓AI學會畫手是一個難以被攻克的問題,現在已經不是多難的事情

近期,隨著美國OpenAI研發的聊天機器人程式ChatGPT(全名:Chat Generative Pre-trained Transformer)釋出,AI進化的譜曲達到最高章。

ChatGPT是特殊的一個。他是根據自然語言處理任務的人工智慧,其運作邏輯可以根據學習人類的語言來進行對話,並能根據上下文理解而進行互動,並隨著交流量的增加而不斷智慧化。同時,ChatGPT在這套學習思維的基礎上,能夠完成許多以前只有”人“才能做到工作,比如翻譯、文案、程式指令碼與各種影音化的處理任務,功能之豐富,簡直就是AI界的百科全書。

大AI時代即將到來?AI技術能解放多少技術力

也因為ChatGPT這個爆炸性產品的誕生,關於AI生產力的話題也被推到臺前。事實上,除了當紅的ChatGPT以外,各行各業也在催生出自己的AI軟體。

那麼還有什麼AI軟體正在埋頭髮展呢?

這篇文章來匯中一下這些AI產品,順便做點猜想,看看他們能為遊戲行業帶來什麼。

多點開花的AI生產力介紹

無論是ACG行業,還是影視多媒體與平面設計等行業,談起生產力逃不開這幾個方面:音訊、音樂、美術插畫、影片與指令碼程式等方向。接下來從這幾個類別去看看,有什麼工具已經實現了一定程度上的生產力。

01美術插畫:Midjourney和Stable Diffusion

當今最火的美術插畫AI工具,當屬由David Holz領導開發的Midjourney;以及Stability AI公司的Stable Diffusion了。

兩個工具都是在消費級GPU上就能運作,Stable Diffusion甚至得到蘋果平臺的最佳化,在iPhone、iPad、Mac等裝置上也能夠流暢執行,低門檻接觸是這是兩個工具能夠迅速躥紅的一個原因,哪怕你沒有最頂級的電腦,也能上手把玩一下。

兩款AI作圖工具,其人工智慧模式相近,都是將文字資訊向影像擴散的模型組合。簡單來說,就是使用者提供各種文字,工具再根據文字的資訊去生成使用者想要的影像。比如在Stable Diffusion裡,你提供文字宇航員+騎+各種坐騎的描述性文字,那麼就會生成出宇航員騎著各種奇幻生物的圖片出來。

大AI時代即將到來?AI技術能解放多少技術力

不同的是,兩款工具的運營模式並不相同。

Stable Diffusion是一款開源的AI作圖工具,它最大的優勢就是自由度、沒有太多束縛,使用者在提供素材時也會引入各種非版權圖片,對於提高素材量與美術風格的外掛也是來者不拒,讓Stable Diffusion對於各種美術風格都能很好駕馭,我們常見的各種AI個性化畫風的嘗試大多出自Stable Diffusion。

大AI時代即將到來?AI技術能解放多少技術力

大AI時代即將到來?AI技術能解放多少技術力
中國風,水墨畫法與寫實,Stable Diffusion各種風格都能嘗試

也因為開源的優勢,Stable Diffusion還能玩出更多玩法,比如它可以拿來壓縮圖片,且壓縮圖片的細節能夠保留更多,這對於壓縮技術來說也是一項大的突破。

大AI時代即將到來?AI技術能解放多少技術力

再比如,它可以對各種圖片與影片進行定製化美術風格輸出/細化,加工出更加美觀的美術圖與影片。雖然目前這套加工模式還不成熟,比如美術細化圖片的文字會亂碼;比如影片輸出還無法穩定;再比如一些比較大的動作無法精準定位還原等問題都讓Stable Diffusion投入實際生產有著一定距離,但這種加工技能的點滿,為解放生產力提供非常大的期待值。

大AI時代即將到來?AI技術能解放多少技術力
原圖與加工新畫風的AI圖片對比,文字亂碼依然是加工圖片一個問題(圖片來自二次元假小子控吧)

至於Midjourney則是一款收費作圖工具。該工具的環境相對封閉,使用的圖片素材也大多是版權圖片。因此,能夠調教和生產的圖片並沒有Stable Diffusion多樣。

但也得益於穩定的版本更迭,尤其是到了V5版本以後,Midjourney對於畫幅比例、紋理效果以及AI處理手與牙齒等細節的侷限做出了很多最佳化,因此讓Midjourney總能生成出更加精美且沒有破綻,足夠以假亂真的美術產物讓業內震撼。比方說之前有關Midjourney最大的新聞就是透過一些文字生成出一套背景是上世紀90年代、中國城市的年輕青年的老照片圖片。

大AI時代即將到來?AI技術能解放多少技術力
經過這次更新,Midjourney變得非常強大

大AI時代即將到來?AI技術能解放多少技術力
Midjourney V5做出90年代風格的AI照片

也因為Midjourney更定製與職業,目前已有不少從業者開始嘗試利用Midjourney輔助創作,比如就在近期,國外一位從業20多年的獨立開發者就分享了自己使用AI對人物建模設計的一些輔助創作成果,據他所言,人物建模設計上節省了40個小時,在場景構建上節省了3天的時間。

大AI時代即將到來?AI技術能解放多少技術力

同時在3D領域,很多公司也開始了AI的3D美術生產工具的探索,比如著名引擎大廠Unity剛剛在GDC2023上,宣佈了自家的Unity AI;其次,Adobe也釋出了自家的AI工具Firefly,不僅能利用AI生成圖片,還能製作模板、編輯P圖效果與創造筆刷、更替背景等多種一鍵生產功能,並且也能直接用自然語言修改圖片。在商業化美術領域,AI的發展可說是進入日新月異,萬箭齊發的階段。

大AI時代即將到來?AI技術能解放多少技術力

02影片:wonder studio

在美國時間的3月9日下午,Wonder Dynamics公司推出了旗下名為Wonder Studio的AI影片工具,它是一個瀏覽器AI工具,基於雲的人工智慧。它的原理是透過捕捉真人表演的內容進行分析,接著可以將想要投放的CG角色與真人進行替換,AI會自動將燈光、光影與動作匹配到跟真人演員幾乎一致的水平,甚至是面部的微表情也可以做到一鍵替換。

大AI時代即將到來?AI技術能解放多少技術力
目前是一個基於雲資料的人工智慧工具

大AI時代即將到來?AI技術能解放多少技術力

大AI時代即將到來?AI技術能解放多少技術力
替換效果對比

大AI時代即將到來?AI技術能解放多少技術力
現在甚至能做到微表情處理

不僅如此,Wonder Studio還能匯出分層、分析畫面的資料與運動環境,讓使用者更多角度的跟蹤修改,做出更理想的效果。

大AI時代即將到來?AI技術能解放多少技術力

大AI時代即將到來?AI技術能解放多少技術力
還能對具體影片的情況去調整

03音訊方面、模擬人聲:VITS

VITS全稱Variational Inference with adversarial learning for end-to-end Text-to-Speech,是一種基於聲學模型進行語音合成方法的AI音訊類工具,它能根據使用者提供的語音合成模型,配合使用訓練好的語音編碼器vocoder聲碼器對使用者提供的文字進行轉化,vocoder會根據發音規則與文字的標題符號作為生成語音訊號的特徵去表示,最後做出一段流暢的語音。

大AI時代即將到來?AI技術能解放多少技術力

目前該工具的生成語音質量已經非常成熟,不僅可以模擬出想要的音色,連節奏與情緒感都能做到完美復原,甚至還能讓輸出的人聲進行唱歌這類複雜的聲音表達,達到足夠以假亂真的程度。也因此在軟體剛開始階段,就已經有大量使用者做出各種音色,遊戲的、動畫聲優的、著名歌星的,應有盡有。

大AI時代即將到來?AI技術能解放多少技術力

但目前該工具還處於較為原始的階段,工具需要大量的複雜的訓練流程,還沒有進入消費級運用的低門檻水平。

04作曲:MusicLM

有了人聲合成,音樂作曲自然也不能少。

在2個月前,谷歌釋出了旗下的AI作曲工具MusicLM。與大多AI工具一樣,MusicLM也是根據輸入文字進行生產音樂的人工智慧。它的前身是基於谷歌去年9月釋出的一項名為AudioLM,專注於合成高保真音訊的專案,也因此,MusicLM並不像美術AI那樣,使用擴散模型進行工作。

大AI時代即將到來?AI技術能解放多少技術力

大AI時代即將到來?AI技術能解放多少技術力
只要文字的描述精準且豐富,無論是古典名畫還是現實題材,都能識別出相應風格,與畫面做出匹配。

不過即便沒有擴散模型的作用,MusicLM目前依然可以做到很多意想不到的音訊處理。比方說,工具不單可以透過文字生成音樂,還能以一段音訊打底+形容的文字,比如樂器或者音樂風格去改編音樂的風格,輸出想要的效果。

大AI時代即將到來?AI技術能解放多少技術力

此外,工具還有一個故事模式,它能將一段音樂根據文字的編排順序去重塑不同時間段的音樂,實現音樂的風格化切片,對於影視化與遊戲配樂而言,這個功能能夠精準對位不同時間段的需要,將多種音樂風格有序的跟畫面需要對上。

大AI時代即將到來?AI技術能解放多少技術力

05基於語言的萬能工具:ChatGPT

作為當紅炸子雞,前文已經提到ChatGPT作為AI聊天程式的基礎功能。它是以語言為基礎,但又不侷限於直接的溝通,OpenAI還為他提供了開源設定,ChatGPT可以安裝各種基於語言模型而設計的外掛,賦予ChatGPT聯網,擴充套件運算的能力,這大大拓寬了了ChatGPT的使用場景。

大AI時代即將到來?AI技術能解放多少技術力

目前已知的外掛想要擴充的方向比如說:

  • 與第三方應用程式連線,利用ChatGPT的機制完成包括日常行程、購物、導航等功能;
  • 利用WolframAlpha等外掛,讓ChatGPT獲得更強大的計算能力,讓回覆內容更加精準/豐富;
  • 對錶格、文件與影片音訊檔案進行內容的分析、繪製與視覺化操作;
  • 延展出更多精細的操作,包括計算力引擎、 影片剪輯、 圖片PS、指令碼設計與文字翻譯,全面覆蓋語言工具所能做到的極限。

也因此ChatGPT才會那麼火熱,它的發展幾乎涵蓋了工具化的大多數方面,有了它可以解決很多事情。

那麼,盤點了這麼多工具以後,基於目前發展的情況,讓我們對AI工具化做點猜想,看看它們以後能夠對遊戲行業做出哪些改變?

解放生產力的一些方向觀察與猜想

①節省人力成本、降低入門門檻

現在開發遊戲是一項高門檻、高投入的產業,尤其在很多3A大作裡尤為明顯。此前業界不少廠商就遊戲定價20年,但開發成本卻逐年走高的現象多有抱怨。

大AI時代即將到來?AI技術能解放多少技術力
現在的3A遊戲專案的開發成本已經可以比肩大片,但很多遊戲要靠單純賣盤獲得大片的收益可不容易

而遊戲成本走高的一個原因就在於高昂的人力成本無法節省,尤其是業界對於遊戲畫面要求越來越高的現在,往往需要龐大的美術團隊去做高精度美術與高模的精雕細琢工作。

大AI時代即將到來?AI技術能解放多少技術力
在很長一段時間高畫質、高材質需要靠人力去填,以後就不好說了

那麼這些批次精細活的工作就可以輪到繪圖AI工具入場了。形成一套一個主美把控核心創作輸出,利用AI去做批次生產與高精細化的工作流程。

像Stable Diffusion目前就有外掛去做類似的工作內容。只是目前可選擇美術風格還不夠多,製作出來的樣品也不夠精細,但如果繼續發展下去的話,未來可期。另外,需要大人力資源去填的內容如果能夠靠AI彌補,也一定程度降低了開發門檻。獨立開發者能製造的遊戲的範圍能夠進一步擴大。

比方說,目前就有很多中日的同人遊戲開發者開始嘗試用AI去做一些低成本的同人遊戲,畢竟很多同人遊戲並沒有商業化,很適合去做AI工具化的嘗試。有的同人團隊是利用AI作畫,有的則是讓AI幾乎包辦所有工作,比如B站up主“秋之雪華”就製作了一款名叫《夏末彌夢》的galgame,整段已公開的Demo影片中,從美術到培養配樂全是有AI完成。

大AI時代即將到來?AI技術能解放多少技術力

②試錯成本降低、效率提升

這是AI工具化最先能做到的事情,甚至一些工具已經能做得不錯。

比如前文提到的某國外美工利用Midjourney速度輸出角色的設計稿輔助建模就節省了大量時間。不僅是美術AI工具,其他的領域比方說指令碼與影片建模,我們也可以可以根據ChatGPT去快速輸出指令碼然後進行最佳化;或者利用Wonder Studio影片AI工具的一鍵替換去觀摩建模在實際運用的效果。

大AI時代即將到來?AI技術能解放多少技術力

藉助AI技術改善產業生產效率差,幾年還不見得做出一款遊戲的情況。

③本地化能力大大提高

本地化一直是遊戲多地區發行的一個命門。不少大型遊戲往往需要在不少地區去做語言跟進;客服端與手遊遊戲甚至需要運營大量外語人工去維護更新與交流,其成本不低,而且往往出力不討好。很多時候的翻譯質量與本土化水平並不能讓玩家滿意。

而目前像ChatGPT等工具的出現給了改進本地化水平的可能性。比方說就目前ChatGPT的翻譯效果,在不少玩家嘗試下,往往能有很不錯的效果,如下圖:

大AI時代即將到來?AI技術能解放多少技術力
(圖片來自PSN中文站使用者heyoutui)

至於AI運營與客服系統,早在目前就已經開始普及開來,唯一的問題就在於表述過於機械、語言過於無感,還有適配的語言不足等不夠智慧的問題,但這些毛病如果接入ChatGPT與音訊合成的VITS等進行適配與升級,那麼,遊戲的國服分發與運營壓力將隨著AI的進步而逐步減壓。

④宣發物料的效率提升與成本將降低

常見的宣發,如短影片、海報、趣圖與玩梗的文案和速遞新聞也可以依靠AI速度生產,比如目前Adobe宣傳的平面軟體Firefly,主打的就是快速處理圖片各種風格的AI機制,若能做到投入生產力的水平,無疑能讓宣發更容易很多。

大AI時代即將到來?AI技術能解放多少技術力

大AI時代即將到來?AI技術能解放多少技術力
一鍵處理想要的P圖效果

其次,目前ChatGPT的文案處理能力已經越來越成熟,比方說你給他提案一個新聞/活動議題,它就已經能生成出一個還可以的模版,就當下來說,給予AI提供的模版去修正文案以獲取自己想要的宣發文案,是已經可以做到的現實。

大AI時代即將到來?AI技術能解放多少技術力
根據某個遊戲設計一場預計20人的現下活動(圖片來自廈門UPGAME)

⑤音、影片成本也將大幅度降低

遊戲常備的音樂、配音與影片也將隨著AI技術的成熟做到更多更方便的做法。

比方說利用Wonder Studio讓遊戲的3D建模去適配影片,減少比如用手K去調整建模動作的工作量;比方說,利用VITS降低配音成本與配音的可適用範圍,遊戲公司只需要提取聲優的音色,就能靠AI生成各種情感與臺詞;再比如利用MusicLM去為遊戲的各種畫面去適配音樂,即便無法直接商用,也能讓主創更好抓準風格進行精細的修改。

大AI時代即將到來?AI技術能解放多少技術力
我想要井上喜久子與平野綾的聲線,AI結合原型聲音模型做出來就可以了

這方面的推進也是預期可見的進度。比如光線傳媒的光線動畫就在之前公開討論AI補充動畫作畫的可行性,並放出了AI作圖的宣發。

大AI時代即將到來?AI技術能解放多少技術力

總結

AI的發展過於迅猛,以至於現在寫下的文章可能過兩天就會被推翻也說不準。近日各大遊戲公司也開始了自己的AI軟體開發,比如育碧公佈內部AI寫作工具Ubisoft Ghostwriter,它目前能輔助編劇進行臺詞創作,以後還能能做到什麼程度現在還是個未知數。

大AI時代即將到來?AI技術能解放多少技術力

但AI的進步目前依然逃不開很多問題:

比方說版權問題,目前AI的生產品一般離不開對原素材的加工,所以經常侵犯一些創作者的權益,這如何改進?

又比方說,適用性問題。目前AI大多基於程式與文字表述進行生成,有著門檻高和不夠直觀的問題,是否有能推進操作邏輯簡易化的可能;當然還有關於資源的壟斷問題,會不會因為AI發展的爆發,以後生產力的核心被幾家AI公司所控制,過高的壟斷成本會不會阻礙AI技術的發展?這些矛盾都很難說。

不過不少問題已經被重視,比如AI作畫開始建立屬於AI自己的素材庫網站civitai。很難說,這些現實的矛盾能阻擋AI發展多久,也許,AI的生產力投入就不在明日也說不準。

大AI時代即將到來?AI技術能解放多少技術力

參考資料:
AIGC教程:如何使用Midjourney節省70%時間,製作3D遊戲角色
https://mp.weixin.qq.com/s/BIKv_GG_44on5bnsg1vcWQ
UNBELIEVABLE AI Video & VFX -- WonderStudio / VFX and 3D Made EASY!
https://www.youtube.com/watch?v=qw4ez2bIOQE
【VITS】語音合成介紹篇 (一):什麼是VITS
https://www.bilibili.com/read/cv20837189
Google's MusicLM: Text Generated Music & It's Absurdly Good
https://www.youtube.com/watch?v=2CUKU2iAzAs
【ChatGPT Plugins】史詩級更新,9 個外掛例項自動完成任務!開啟你
https://www.bilibili.com/opus/776650913330757639?from=search&spm_id_from=333.337.0.0
首個AI繪圖AI配音的同人GAL實機demo《夏末彌夢》
https://www.bilibili.com/video/BV1uV4y1L7o1/?vd_source=4d33fe977344618c76ddda8e8695906d


原文:https://mp.weixin.qq.com/s/mmd5IYmzl9RP7D82yky3hA

相關文章