為什麼使用遊戲音訊中介軟體?

遊資網發表於2020-03-17
國內遊戲發展速度極為迅速,短短十幾年時間遊戲的引擎、玩法、畫面表現等皆得到了極大的發展。然而作為遊戲不可缺少的一部分,遊戲音訊技術卻相比於畫面,效能等發麵發展極其緩慢。現如今較多的遊戲公司已經開始重視遊戲音訊,引進遊戲音訊技術以創造更好的遊戲音訊體驗。

本文主要從2個方面來簡介遊戲音訊中介軟體:為什麼使用遊戲音訊中介軟體,目前世界上最為先進的遊戲中介軟體介紹。

從這兩個方面來闡述遊戲中介軟體的作用以及可以利用中介軟體創造的效果。

一、為什麼使用遊戲音訊中介軟體

在討論為什麼使用音訊中介軟體前我們要先了解

1·什麼是遊戲音訊中介軟體

所謂音訊中介軟體,簡單來講即為對遊戲音訊的解決方案。

遊戲音訊中介軟體整合了可以公共設定的音訊處理辦法,並將其構造在編輯器中,聲音設計師可以使用編輯器來獨立的創造遊戲音訊價格和播放機制,而不需要程式程式碼參與其中,在完成了架構後,在根據遊戲音訊中介軟體提供的SDK與程式設計師進行對接,完成整個遊戲的音訊架構和播放機制。

在其中創造過程獨立於程式程式碼,聲音設計師可以完全按照自己的意願利用編輯器來創造合適的音訊體驗,此過程中無需程式介入繼而節省了很多的溝通和研發成本。

在這裡我借用CRI-ADX2的介紹來說明遊戲中介軟體。

為什麼使用遊戲音訊中介軟體?

可以看到一般聲音設計師所創造的聲音檔案經過編輯器進行處理和打包後,將相關內容提供給程式設計師,程式設計師根據聲音設計師在編輯器中所完成創造的事件(在ADX2中被稱為Cue,而在Wwise和Fmod中被稱為Event)決定何時播放事件,從而簡化整個工作。

以上便是遊戲音訊中介軟體的簡單工作原理。

2·為什麼要使用遊戲音訊中介軟體

瞭解了遊戲音訊中介軟體,我們來說說為什麼使用遊戲音訊中介軟體。想必這個問題是大家最關心的問題,一個遊戲的開發本身就有較大的成本,那麼為什麼我們又要使用具有授權費用的遊戲音訊中介軟體呢?

(1)成本

做個假設,我們正在開發一個RPG遊戲,那麼無論我們使用任何引擎,音訊的播放規則上我們都需要程式設計師和音訊設計師溝通,來決定每一個音訊應該如何播放。程式設計師需要根據聲音設計師設計的播放規則來逐個抒寫程式碼來完成功能,那麼這其中就夾雜了大量的碼程式碼時間以及聲音設計師和程式設計師的溝通成本。

雖然任何一個遊戲音訊中介軟體都有授權費用,但對於每次開發一個遊戲都需要重新寫播放規則的時間成本,人力成本以及聲音設計師和程式溝通的時間成本和人力成本相對要少很多。

舉個例子來說,如果聲音設計師設計了這樣一個規則,當角色死亡的時候我們希望所有的聲音全部變得模糊,讓玩家感受到較為模糊窒息的感受來強化死亡體驗。那麼針對這個規則,程式設計師首先需要知道這個效果如何實現,其次要寫很多的程式碼來完成這個效果。

實際上這個效果使用簡單的一個低通濾波既可以達到,然而如果不使用遊戲音訊中介軟體,設計師只能在DAW上模擬效果很難告訴程式應該如何達到效果,其次低通濾波的處理效果對於目前國內音訊處理來言相對較為難以實現。而如果使用了音訊中介軟體,設計師完全可以在編輯器中實現效果,且程式只需要播放某個事件或者更改某個引數即可達到效果。

除此之外,設計師可以利用編輯器很快的完成音訊的處理,可以有更多的時間專注創作,完善音訊體驗,程式設計師則也省去了大量的工作,可以更好的為遊戲其他方面進行優化,更好的完善遊戲。

綜上,音訊中介軟體雖然有授權費用但能大量減少溝通,人力等成本。

(2)效果

效果我們分為兩部分嗎,一個是靜態效果處理,另一個是互動式動態效果處理。

①靜態效果處理

靜態效果處理指完全由設計師主導的處理方式,例如多樣本隨機,音調的隨機變化,靜態聲道隨機變化等。

這些效果在音訊中介軟體中是極其基本的功能,而聲音設計師可以利用這些功能做到較少素材的較大效果變化,而且效果更佳突出,這也是不使用音訊中介軟體無法達到的效果。

②動態效果處理

動態效果處理指動態的變化產生的音訊本身的變化,例如到達不同空間有不同混響效果,互動式音樂播放,動態混音處理等。這些功能我們一一詳述。

空間效果變化:

在原始素材中,我們渴望遊戲聽起來能有更加立體的效果,這時候聲音設計師在製作素材的時候往往會加入一些混響效果來達到這個目的,這雖然可以達到效果立體化的目的,但是他不具備變化的特性,因為混響效果是加在素材層面的,根本無法更改素材的混響效果。

當使用音訊中介軟體後,我們不再將混響效果加在素材層面,而是放置在遊戲中,當角色達到固定區域是,可以呼叫混響效果的介面,改變混響效果的大小,或者更改混響效果引數,變化混響強弱。這種動態式的混響效果除了完成了素材的立體化外還為玩家創造了一個更生動的場景和遊戲體驗,也是沉浸式遊戲體驗不可或缺的內容。

互動式音樂播放:

提起互動式音樂播放我想大家一定想起了3A大作,對於3A大作來說,互動式音樂必不可少,音樂的作用完全可作為情緒調節和調動作用。面對美如畫的場景時播放舒緩的音樂讓人沉浸其中,面對最終死敵時播放激昂的音樂讓人鬥志昂揚,這些音樂之間完美的過渡則能更好的為玩家提供這種沉浸式感受。在音訊引擎的支援下音樂之間的過渡已變為無縫,不會產生任何的斷點這也使得整個遊戲體驗過程完美不突兀。

下面是我曾經設計的某個遊戲的音樂播放規則:

為什麼使用遊戲音訊中介軟體?

整個播放以完全無縫的方式進行過渡,涉及到任何場景,每個場景的音樂都貼合場景以達到最好的沉浸體驗感受。

這些互動式音樂的播放以及切換規則,並非是幾個程式設計師能夠一朝一夕做得出來的,尤其在無縫轉變的處理中有著更深的邏輯和規則。使用了音訊中介軟體則可以輕鬆的完成這些內容,效果也絕對可以做大無縫轉變。

動態混音處理

聲音設計師對於混音這個詞應該並不陌生,混音決定了遊戲內所有音訊的混合播放效果。一般來說,在做好遊戲音訊素材後,聲音設計師會進行一次統一的混音處理,以保證各個音訊在遊戲中混合起來後聽感的正常。這一個過程稱之為靜態混音。

動態混音則是架構在靜態混音之上,是在完成了靜態混音後,在遊戲進行過程中,由於特殊聲音的觸發,動態的更改其他一種或多種聲音,當特殊聲音播放完畢後,被更改的聲音又恢復的動態處理過程。

例如在征程遊戲過程中觸發了語音獨白,為了保證語音獨白能夠更好的被突出,我們會使用Ducking或者SideChain功能,將BGM等聲音音量降低,以保證語音獨白能夠最優先的被聽到。(在CRI-ADX2中有React和SideChain功能,Wwise中有Ducking和SideChain功能而在Fmod中只存在SideChain功能)

除了降低音量外還能夠更改低通,EQ等效果,可以方便和合理的讓聲音設計師設計出非常獨特和出彩的效果。

綜上所述,使用音訊中介軟體完全可以減少成本,並可以更快速,方便的完成更好的設計和音訊效果。使用音訊中介軟體的好處遠不止如此,音訊中介軟體能做到的效果也並非一兩句話即可全部表述的,這些都需要讀者自己去摸索和總結了。

二·遊戲音訊中介軟體

既然遊戲音訊中介軟體能夠創造更好的音訊體驗,那麼目前來說世界級別的遊戲音訊中介軟體有哪些呢?

目前世界級別的遊戲音訊中介軟體一共有三種:CRI-ADX2,Wwise和Fmod

筆者有幸在工作中接觸到遊戲音訊,並對這三款遊戲音訊中介軟體有所瞭解,在此處為大家介紹一二。

1·CRI-ADX2

CRI全稱CRI MiddleWare,是一家日本廠商,主要為遊戲提供音訊和視訊的解決方案,最為出名的就是音訊中介軟體ADX2以及視訊中介軟體Softdec2.

CRI-ADX2目前在日本最為廣泛應用,無疑是日本的音訊處理領頭。

CRI-ADX2介面如下:

為什麼使用遊戲音訊中介軟體?

可以看到類似DAW的介面以及時間線,而左邊從上到下分別是全域性設定,工作區,素材區。

CRI-ADX2有著讓聲音設計師更加熟悉的DAW介面,所有功能也是以此為展開,相對而言更加容易讓聲音設計師上手。

CRI-ADX2的工作原理:



為什麼使用遊戲音訊中介軟體?

Material(素材)分配給各個Cue,在Cue中佔用Truck軌道,而後Cue集合在CueSheet中,經過分裝處理形成ACB檔案以及AWB檔案,這取決於你選擇的播放方式是正常播放還是流播放。此時聲音設計師的工作結束,將分裝完成的ACB和AWB檔案給到程式,並告知CueSheet和Cue即可完成播放。

CRI-ADX2的主要製作在Cue的製作上,可有各個種類的Cue

為什麼使用遊戲音訊中介軟體?

這些不同型別的Cue承載著不同的功能,比如隨機播放,順尋播放,條件播放等等。

在CRI-ADX2中,用於引數控制的稱之為AISAC,他是改變truck軌道,Cue等屬性的引數介面,聲音設計師可以使用AISAC改變素材本身也可以和程式對接動態的更改效果。

CRI-ADX2擁有Fmod和Wwise沒有的一個特別使用就是時間線自動化,該功能可以方便的使用AISAC更改素材本身效果,而在Wwise和Fmod中引數改變一定輸出引數的名稱,也就是沒有自動化更改功能,雖然可以通過事件等方式可以達到目的,但CRI-ADX2在時間線自動化上更加方便,這個結果取決於音訊中介軟體設計目標,Wwise和Fmod更注重動態變化,ADX2則提供了一部分靜態處理。

如圖所示

為什麼使用遊戲音訊中介軟體?

Pitch就是圖中線條所示,可以進行任意的調整。

CRI-ADX2在互動音樂設計上主要使用的是Block,如圖

為什麼使用遊戲音訊中介軟體?

通過Block的劃分做切換的時機,這樣可以讓切換精確到節拍上,讓過渡更加無縫。

CRI-ADX2區別於Wwise和Fmod最大的不同之處在於CRI-ADX2擁有自己的編解碼格式,ADX,HCA,HCA-MX這三種格式為CRI-ADX2的獨有編解碼格式,而Fmod中則使用Vorbis,PCM以及FADPCM,Wwise中則使用Vorbis,PCM,ADPCM以及Opus格式。

以上是ADX2的簡單介紹,不涉及具體用法,僅僅介紹編輯器樣貌以及工作原理。

2·Fmod

Fmod現在主要運用為Fmod Studio,最初Fmod版本為Fmod Design,現如今已經進化成為Fmod Studio,國內一些遊戲廠商開始引擎音訊中介軟體就是使用Fmod。

Fmod介面如下:

為什麼使用遊戲音訊中介軟體?

同樣可以看到類似於DAW的介面,相對音訊設計師來說是相對較好上手。

Fmod工作原理:

為什麼使用遊戲音訊中介軟體?

波形素材檔案分配給各個Event,再將Event分給Bank並打包成Bank檔案後交予程式設計師,程式設計師根根據Bank檔案和Event的名稱進行播放。此期間設計師的工作就是設計架構,創造更好的Event以及更合理的分配Bank檔案。

Fmod的素材部分對音訊格式要求不高,無論是Wav,ogg還是MP3格式Fmod全部都支援匯入,但CRI-ADX2和Wwise僅僅支援Wav格式的匯入。

Fmod Studio的使用上主要為事件中的Instrument使用,Fmod包含了較多的Instrument

為什麼使用遊戲音訊中介軟體?

這些 Instrument決定了音訊素材在軌道上如何根據時間線以及其他引數線進行播放的。

Fmod中parameter作為類時間軸的變化軸引數為使用方式,在軌道上進行Instrument設定,在引數的播放線到達Instrument時,根據Instrument型別進行不同效果的播放。

為什麼使用遊戲音訊中介軟體?

Fmod針對互動式音樂的設計主要來源於多個標記作用

為什麼使用遊戲音訊中介軟體?

Destination Marker是作為基礎標記,用於標註方便其他內容運用。

Tempo Maker則是標記時間軸的節拍和速度的,方便對準節拍,用於精確切換。

Loop Region則是迴圈標記,在其內會不斷迴圈播放。

Transition則是直接切換,會切換到所指明的 Destination Marker位置處

Transition Region則是切換標記,是一個區間內,當出發條件到達時會根據該Transition Region的分割,到達分割點進行切換。該功能除了做切割使得節拍點轉變外還能進行轉變的過渡段增加,使得轉變更加平滑。

其中Transition,Transiyion Region和Loop Region可以設定引數條件,使之觸發。

如圖:

為什麼使用遊戲音訊中介軟體?

圖中是筆者設計完成的一個相對較為複雜的互動音樂,可以看到運用了上述幾乎所有的標記,以及parameter,這是一個完全無縫的互動音樂設計,但從功能上來說運用了Fmod的互動設計內容,看似複雜但如果理清播放規則,可以很有邏輯性的完成設計製作。

Fmod在互動音樂的過渡中相比Wwise和CRI-ADX2少了一個同時播放的過渡,例如白天和黑夜的切換過程,一般同一個地區的白天和黑夜,音樂設計上是隻改變配器不改變其他,因此如果同時播放,到達時間點按照小結進行切換會非常平滑,而Fmod中不具備時間同步切換的功能。

3·Wwise

Wwise現階段在國內的發展迅速,從騰訊大批量使用Wwise後,Wwise在國內音訊的普及量得到了迅速的發展。

Wwise的介面如下:

為什麼使用遊戲音訊中介軟體?

wwise和ADX2以及Fmod的介面差別較大,沒有類似DAW式的編輯區,取而代之的是各個引數圖形,這使得wwise的理解和學習相對於Fmod和ADX2稍微有一點難度。

Wwise工作原理

為什麼使用遊戲音訊中介軟體?

聲音設計師設計製作完成素材檔案後,將素材檔案根據播放規則放在wwise編輯器中的各種Container中,而後將各個Container放在Event中,並將Enent指定到Bnk中,並生成Bnk檔案,Wem則是選擇使用流播放後生成的檔案。將Bnk檔案交付程式設計師後,程式設計師根據Bnk和Event名稱來播放音訊。

Wwise包含大量的Container,這決定了基礎播放規則

  • Random Container隨機播放容器
  • Sequence Container順序播放容器
  • Switch Container條件播放容器
  • Blend Container混合播放容器

這些容器可以相互混合使用,使得播放效果可以各種巢狀,有著非常大的靈魂性,類比於Fmod的Event巢狀,Instrument巢狀以及ADX2的Cue巢狀,他們都提供了強大而靈活的播放規則設計。

Wwise針對引數做了三種型別,RTPC,Switch和State,他們其實都是引數的範圍內,只是RTPC是連續變化的,而Switch和State則是跳變的狀態轉變,不具備連續性。對於Switch和State的區別則是:State是全域性變化,而Switch是單個變化。

簡單來說就是State變化後,整個遊戲和該State掛鉤的會全部變化,而Switch變化時則時該event單獨變化不影響其他。

RTPC:

為什麼使用遊戲音訊中介軟體?

State

為什麼使用遊戲音訊中介軟體?

在互動式音樂層面,Wwise則使用獨立的互動式音樂設計方案,他與其他音訊設計位置不同有專用的Interactive Music Hierarchy。

如圖所示:

為什麼使用遊戲音訊中介軟體?

這裡通過構建Switch和State作為播放條件設計填充了整個音樂播放架構,在Transition中進行轉變的設計,從而達到無縫切換音樂。

使用思路上Wwise利用了原本的State和Switch作為條件管理整個音樂播放規則。

圖中展示的就是通過條件來完成的播放規則內容。

Wwise除了征程Event外還提供了一個新的功能:Dynamic Dialogue動態對話。

以一個正常多選擇向遊戲,當玩家選擇不同的對話時需要有不同的音訊內容來播放,Wwise的Dynamic Dialogue動態對話功能就為這種音訊設計提供了方便

為什麼使用遊戲音訊中介軟體?

圖中所示的就是一個動態對話的應用方式,他類似於互動式音樂設計也是通過Switch和State作為條件決定最終的播放內容。

4·綜合

CRI-ADX2,Fmod和Wwise各自的介面應用方式不同,但他們都能為設計者和程式提供方便以及提供更強大的設計效果。

除上述簡述的內容外,三個引擎都支援2D,3D效果,DSP(Wwise中稱之為Bus),以及各種各樣的Plug-in,他們的各自功能並非以上內容能夠涵蓋的,且在使用上由於都具有各種應用效果,巢狀等可以實現多種多樣的需求。

簡述三個音訊中介軟體沒有任何對比的意思,只是各自用法不通用,實際用哪一個要看讀者自行選擇。

結語:

音訊中介軟體的引入極大的優化的音訊設計,降低了效果實現的難度,同時也為更好的沉浸式音訊做好了技術支援。

筆者致力於研究音訊中介軟體,音訊中介軟體的內容之多絕不可能一文即可全部講述完畢,三個音訊中介軟體各自的用法也會在後續過程中逐漸向大家介紹。

最後也希望國內遊戲的音訊能夠達到最高階的水準。


來源:騰訊遊戲學院
原文:https://gameinstitute.qq.com/community/detail/127695

相關文章