由淺到淺入門批量渲染（一）

枸杞憂天發表於2020-11-16

原文網址 : https://www.gameres.com/876755.html

嘿嘿，確實是好久沒有更新了...

最近在準備公司的技術分享，主題是入門批量渲染，想著反正也總結了，不如充幾篇部落格吧，也算顯得沒有那麼半途而廢，一舉兩得了。

所以，這次將分四篇介紹一下與批量渲染有關的知識：

第一篇的主題是靜態合批；
第二篇的主題是動態合批；
第三篇的主題是例項化渲染；
第四篇的主題是優化骨骼蒙皮動畫，以及兩種常用的批量渲染方式：烘焙頂點動畫與烘焙骨骼矩陣動畫。

由於這回更新的內容還是非常基礎的，所以系列也稱為“由淺到淺”，如果你剛接觸Unity引擎不久，或者面試時不知道怎麼忽悠面試官，相信讀完以後，恐怕也不會有什麼大的收穫。

另外，其實很久之前寫過一篇關於例項化角色動畫的文章，現在看來裡面存在很多的不足以及表述錯誤，希望趁著這次機會能糾正過來，順便再寫一些新的不足和錯誤。

那就開始吧。

批量渲染

批量渲染其實是個老生常談的話題，它的另一個名字叫做“合批”。在日常開發中，通常說到優化、提高幀率時，總是會提到它。

可以簡單的理解為：批量渲染是通過減少CPU向GPU傳送渲染命令（DrawCall）的次數，以及減少GPU切換渲染狀態的次數，儘量讓GPU一次多做一些事情，來提升邏輯線和渲染線的整體效率。但這是建立在GPU相對空閒，而CPU把更多的時間都耗費在渲染命令的提交上時，才有意義。

如果瓶頸在GPU，比如GPU效能偏差，或片段著色器過於複雜等，那麼沒準適當減少批處理，反而能達到優化的效果。

所以要做效能優化，還是應該先定位瓶頸到底在哪兒，然後再考慮優化方案，而不是一股腦的就啪啪啪合批。

當然，通常情況下，確實是以CPU出現瓶頸更為常見，所以適當的瞭解些批量渲染的技法，是有那麼一丟丟必要的。

靜態合批

靜態合批是一種聽起來很常用，但在大多數手遊專案裡又沒那麼常用的合批技術。

這裡，我簡單的將靜態合批分為預處理階段的合併，和執行階段的批處理。

合併階段

合併時，引擎將符合合批條件的渲染器身上的網格取出，對網格上的頂點進行空間變換，變換到合併根節點的座標系下後，再合併成一個新的網格；這裡需要注意的是，新網格是以若干個子網格的形式組合而成的，因為需要記錄每一個合併前網格的索引數量和起始索引（相對於合併後的新網格）。

空間變換的目的，是為了“固化”頂點緩衝區和索引緩衝區內的資料，使其頂點位置等資訊都在相同的座標系下。這樣執行時如果需要對合並後的物件進行空間變換（手動靜態合批物件的根節點可被空間變換），則無需修改緩衝區內的頂點屬性，只提供根節點的變換矩陣即可。

儘管網格不同、材質不同，Unity也會將它們的網格進行合併

在Unity中，可以通過勾選靜態批處理標記，讓引擎在打包時自動合併；當然，也可以在執行時呼叫合併函式，手動合併。

通過勾選開關標記單位參與靜態合批

打包時的自動合併會膨脹場景檔案，會在一定程度上影響場景的載入時間。

包含靜態合批的場景體積大了一丟丟

此外，不同平臺對於合併是有頂點和索引數量限制的，超過此限制則會合併成多個新網格。

批處理階段

執行時是否可以合批（Batch）成功，還取決於渲染器材質的設定。

使用不同的材質，會分為不同的批次

當然，如果手動替換過場景中所有Material，也會打斷批次。

執行時手動替換所有渲染器的材質球

不再有合批發生

如果偷偷修改了渲染器使用的網格（不再使用合批後的大網格），也會打斷批處理。

替換網格後，也不會再被批處理

除上述之外，還有一些不常用，且不太有用的知識點。

執行時動態載入？

動態載入並例項化一個帶靜態標記的GameObject到場景中，是不會被當做靜態合批處理的。換言之，靜態標記只被作為是打包時的考慮引數，並不會在執行時被引擎處理。如果在場景載入後，希望對手動例項化的單位進行靜態合批，可以使用手動靜態合批。

合併根節點的空間變換

自動靜態合批的根節點在場景上，因此無法對其進行空間變換；而手動靜態合批，因為根節點不是場景而是一個遊戲物件，所以可以通過修改根節點的空間屬性（位置、大小及縮放值），達到諸如移動整個合批單位的目的。

當然，即使修改了合批後物件的空間屬性，頂點和索引緩衝區裡的資料也不會被修改，引擎會在渲染前，通過ConstBuffer（UniformBuffer）傳入根節點的變換矩陣，達到了整體變換的目的。

Batch ≠ DrawCall

一次靜態合批，並不表示一定只有一次DrawCall命令的呼叫。

合併發生後，每個參與合批的網格資訊（頂點、索引等）就會被最終確定，不再被修改。當一個參與合併的單位不顯示時，如被設定為隱藏或被視椎體剔除，引擎並不會修改頂點緩衝區和索引緩衝區的內容，而會拆分若干個小的DrawCall來分次渲染。通過調整每個DrawCall的索引（起始索引、索引個數）來跳過不應該被顯示的單位。

通過兩次DrawCall來跳過隱藏的三角形

由於，這些DrallCall之間幾乎沒有渲染狀態的切換，效率較高，所以引擎也將其統計為一次合批（儘管包含若干個DrawCall）。

隱藏掉部分立方體後，形成了兩次DrawCall

引擎的Statistics視窗、FrameDebugger和Profiler(Renderer)會體現出這種差異

靜態合批包含了多個材質時，引擎在材質分組後的處理方式也是相同的，只是不同材質在渲染時，都使用了相同的頂點、索引緩衝區。

與直接使用大網格的不同

靜態合批與直接使用大網格（是指直接製作而成，非靜態合併產生的網格）的不同，主要體現在兩方面。

其一，靜態合批可以主動隱藏部分物件。靜態合批在執行時，由於每個參與合併的物件可以通過起始索引等彼此區分，因此可以通過上述多次DrawCall的策略，實現隱藏指定的物件；而直接使用大網格，則無法做到這一點。

其二，靜態合批可以有效參與CPU的視錐剔除。當有剔除發生時，被送進渲染管線的頂點數量就會減少（通過引數控制），也就意味著被頂點著色器處理的頂點會減少，提升了GPU的效率；而使用大網格渲染時，由於整個網格都會被送進渲染管線，因此每一個頂點都需要被頂點著色器處理，如果攝像機只能照到一點點，那麼絕大多數參與計算的頂點最後都會被裁減掉，有一些浪費。

大網格不會被視錐體剔除，全部頂點都會被送進渲染管線

靜態合批會被視錐體剔除，只有部分頂點被送進渲染管線

靜態合批下合併後的網格

靜態合批下，頂點著色器只處理了部分頂點

當然，這並不意味著靜態合批一定就比使用大網格要更好。如果子網格數量非常多，視錐剔除時CPU的壓力也會增加，所以具體情況具體分析吧~

靜態合批的利弊

靜態合批採用了以空間換時間的策略來提升渲染效率。

其優勢在於：網格通常在預處理階段（打包）時合併，執行時頂點、索引資訊也不會發生變化，所以無需CPU消耗算力維護；若採用相同的材質，則以一次渲染命令，便可以同時渲染出多個本來相對獨立的物體，減少了DrawCall的次數。

在渲染前，可以先進行視錐體剔除，減少了頂點著色器對不可見頂點的處理次數，提高了GPU的效率。

其弊端在於：合批後的網格會常駐記憶體，在有些場景下可能並不適用。比如森林中的每一棵樹的網格都相同，如果對它採用靜態合批策略，合批後的網格基本等同於：單顆樹網格 x 樹的數量，這對記憶體的消耗可能就十分巨大了。

極端情況下可能導致記憶體佔用過高

總而言之，靜態合批在解決場景中材質基本相同、網格不同、且自始至終都保持靜止的物體上時，很適用。

來源：騰訊遊戲學院
原文：https://gameinstitute.qq.com/community/detail/133586

由淺到淺入門批量渲染（二）
2020-11-17
由淺到淺入門批量渲染（完）
2021-01-07
由淺到淺入門批量渲染（四）
2021-01-06
RabbitMQ由淺入深入門全總結（一）
2021-06-15
MQ
promise由淺入深
2018-03-19
Promise
RabbitMQ由淺入深入門全總結（二）
2021-06-17
MQ
lua淺淺入門瞭解一下
2021-09-09
JavaScript Promise由淺入深
2019-03-05
JavaScriptPromise
MySQL索引由淺入深
2021-03-03
MySql索引
物件導向-由淺入深
2018-12-03
物件
[轉帖]由淺入深瞭解GC入門篇（一）：什麼是垃圾回收？
2024-05-22
GC
iOS架構由淺入深 | MVVM
2018-08-05
iOS架構MVVM
純手寫Promise，由淺入深
2019-09-26
Promise
由淺入深理解 IOC 和 DI
2020-08-31
Vue.js 2.0 由淺入深
2021-09-09
Vue.js
由淺到深瞭解工廠模式
2018-09-26
模式
淺入深出Vue：資料渲染
2019-07-01
Vue
Vue入門淺析
2023-05-15
Vue
MVP架構由淺入深篇一（基礎版）
2020-09-25
MVP架構
C#非同步程式設計由淺入深（一）
2021-03-28
C#非同步程式設計
Elasticsearch從入門到放棄：淺談算分
2021-01-27
Elasticsearch
第十八節：Skywalking由淺入深
2024-06-18
由淺入深 docker 系列： (2) docker 構建
2018-11-16
Docker
由淺入深 docker 系列： (3) docker-compose
2018-11-29
Docker
由淺入深理解Dubbo的SPI機制
2019-02-26
由淺入深完全理解Java動態代理
2018-05-28
Java
由淺入深 docker 系列： (6) 映象分層
2019-06-26
Docker
【Fastjson】Fastjson反序列化由淺入深
2021-12-13
ASTJSON
由淺入深學習 Android Binder（三）- java binder深究（從java到native）
2020-12-06
AndroidJava
Git 由淺入深之細說變基 (rebase)
2019-02-27
Git
由淺入深 docker 系列： (5) 資源隔離
2019-05-27
Docker
深入淺出Mybatis原始碼系列（一）---Mybatis入門
2018-09-18
MyBatis原始碼
淺入淺出webpack
2019-03-04
Web
淺入kubernetes(1)：Kubernetes 入門基礎
2020-12-29
零基礎深度學習入門：由淺入深理解反向傳播演算法
2019-03-06
深度學習反向傳播演算法
前端如何理解正則-由淺入深的學習
2020-04-03
前端
【由淺入深_打牢基礎】HOST頭攻擊
2022-06-20
淺入淺出 MySQL 索引
2021-05-17
MySql索引

由淺到淺入門批量渲染（一）

相關文章