Unity DOTS 走馬觀花
本文還在不斷完善,可能不會及時同步在圖靈社群,源文章在我的部落格中:螢火之森 - Unity DOTS 走馬觀花
簡單介紹 Data-Oriented Technology Stack (DOTS, 資料導向型技術棧) ,其包含了 C# Job System、the Entity Component System (ECS) 和 Burst。
特點
DOTS 要實現的特點有:
- 效能的準確性。我們希望的效果是:如果迴圈因為某些原因無法向量化,它應該會出現編譯器錯誤,而不是使程式碼執行速度慢8倍,並得到正確結果,完全不報錯。
- 跨平臺架構特性。我們編寫的輸入程式碼無論是面向 iOS 系統還是 Xbox,都應該是相同的。
- 我們應該有不錯的迭代迴圈。在修改程式碼時,可以輕鬆檢視為所有架構生成的機器程式碼。機器程式碼“檢視器”應該很好地說明或解釋所有機器指令的行為。
- 安全性。大多數遊戲開發者不把安全性放在很高的優先順序,但我們認為,解決Unity出現記憶體損壞問題是關鍵特性之一。在執行程式碼時應該有一個特別模式,如果讀取或寫入到記憶體界限外或取消引用Null時,它能夠提供我們明確的錯誤資訊。
其中向量化指的是 Vectorization。
向量化的相關介紹:
- https://stackoverflow.com/questions/1422149/what-is-vectorization
- https://www.wikiwand.com/en/Array_programming
Burst
Unity 構建了名為 Burst 的程式碼生成器和編譯器。
當使用 C# 時,我們對整個流程有完整的控制,包括從原始碼編譯到機器程式碼生成,如果有我們不想要的部分,我們會找到並修復它。我們會逐漸把 C++ 語言的效能敏感程式碼移植為 HPC# 程式碼,這樣會更容易得到想要的效能,更難出現 Bug,更容易進行處理。
如果 Asset Store 資源外掛的開發者在資源中使用 HPC# 程式碼,資源外掛在執行時程式碼會執行得更快。除此之外,高階使用者也會通過使用 HPC# 編寫出自定義高效能程式碼而受益。
ECS Track: Deep Dive into the Burst Compiler - Unite LA
Burst 對於 HPC# 更詳細的支援可以在下面找到:
深入棧
向量化(Vectorization)無法進行的常見情況是,編譯器無法確保二個指標不指向相同的記憶體,即混淆情況(Alias)。Alias 的問題在 Unity GDC 中也有一個演講提到過:Unity at GDC - C# to Machine Code。
Collections 類就是為了解決這個問題而誕生的,裡面包含 NativeList、NativeHashMap、NativeMultiHashMap 和 NativeQueue 四種額外的資料結構。
兩個 NativeArray 之間從不會發生混淆這種情況,這也是為什麼我們將會經常使用這些資料結構。我們可以在 Burst 中運用這個知識,使它不會由於害怕兩個陣列指標指向相同記憶體而放棄優化。
Unity 還編寫了 Unity.Mathemetics 數學庫,提供了很多像 Shader 程式碼的資料結構。Burst 也能和這數學庫很好的工作,未來 Burst 將能夠為 math.sin()
等計算作出犧牲精度的優化。
對於 Burst 而言,math.sin()
不僅是要編譯的 C# 方法,Burst 還能理解出 sin()
的三角函式屬性,同時知道 x 值較小時會出現 sin(x)
等於 x 的情況,並瞭解它能替換為泰勒級數展開,以便犧牲特定精度。
跨平臺和架構的浮點準確性是 Burst 未來的目標。
傳統模式的問題
傳統模式指的是什麼呢?
- 跟 MonoBehaviours 打交道
- 資料和其處理過程耦合在一起
- 高度依賴引用型別
問題一:資料分佈在記憶體的各個角落
離散的資料導致搜尋效率十分低下,還有 Cache Miss 的問題,這個問題可以參考下面的連結:
問題二:很多不必要的資料也被提供了
例如當我們要呼叫 Transform 時,可能實際上我們只需要 position 和 rotation 兩個屬性來移動 gameObject,但是其他不需要的資料也被提供給了 gameObject。
問題三:低效的單執行緒資料處理
傳統模式只使用單執行緒來按順序一個一個地處理資料和操作,這樣十分低效。
高效能 C#
當我們使用 C# 語言時,仍然無法控制資料在記憶體中如何進行分佈,但這是我們提升效能的關鍵點。
除此之外,標準庫面向的是“堆上的物件”和“具有其它物件指標引用的物件”。
也就是意味著,當處理效能敏感程式碼時,我們可以放棄使用大部分標準庫,例如:Linq、StringFormatter、List、Dictionary。禁止記憶體分配,即不使用類,只使用結構、對映、垃圾回收器和虛擬呼叫,並新增可使用的部分新容器,例如:NativeArray 和其他集合型別。
我們可以在越界訪問時得到錯誤和錯誤資訊,以及使用 C++ 程式碼時的偵錯程式支援和編譯速度。我們通常把該子集稱為高效能 C# 或 HPC#。
它可以被總結為:
- 大部分的原始型別(float、int、uint、short、bool...),enums,structs 和其他型別的指標
- 集合:用
NavtiveArray<T>
代替T[]
- 所有的控制流語句(除了 try、finally、foreach、using)
- 對
throw new XXXException(...)
給予基礎支援
Job System
Job System 是針對上述傳統模式問題的一種解決方式。例如下圖可以把發射子彈看成一個 Job,從而用多執行緒來並行地處理髮射操作。
目前主流的 CPU 有 4-6 個物理核心,8-12 個邏輯核心,多執行緒處理將能夠更好地發揮 CPU 的效能。
傳統的多執行緒問題也有很多:
- 執行緒安全的程式碼十分難寫
- 競態條件,也就是計算結果依賴於兩個或更多程式被排程的順序
- 低效的上下文切換,切換執行緒的時候十分耗時
而 Job System 就是專注解決上面問題的一個方案,這樣我們就能享受著多執行緒的好處來開發遊戲。當然了,我們也要寫出正確的 ECS 程式碼,熟悉新的開發模式。
解決的多執行緒問題
C++ 和 C# 都無法為開發者編寫執行緒安全程式碼提供太多幫助。即使在今天,擁有多個核心遊戲消費級硬體發展至今已經過去了十年,但依舊很難有效處理使用多個核心的程式。
資料衝突,不確定性和死鎖是使多執行緒程式碼難以編寫的挑戰。Unity 想要的特性是“確保程式碼呼叫的函式和所有內容不會在全域性狀態下讀取或寫入”。Unity 希望應該讓編譯器丟擲錯誤來提醒,而不是屬於“程式設計師應遵守的準則”,Burst 則會提供編譯器錯誤。
Unity 鼓勵 Unity 使用者編寫 “Jobified” 程式碼:將「所有需要發生的資料轉換」劃分為 Job。
Job 會明確指定使用的只讀緩衝區和讀寫緩衝區,嘗試訪問其它資料會得到編譯器錯誤。Job 排程程式會確保在 Job 執行時,任何程式都不會寫入只讀緩衝區。Unity 也會確保在 Job 執行時,任何程式都不會讀取讀寫緩衝區。
如果排程的 Job 違反了這些規則,我們會得到執行時錯誤(通常這種錯誤會在競態條件出現時得到)。錯誤資訊會說明,你正在嘗試排程的 Job 想要讀取緩衝區 A,但你之前已經排程了會寫入緩衝區 A 的 Job ,所以如果想要執行該操作,需要把之前的 Job 指定為依賴。
Entity Component System
Unity 一直以元件的概念為中心,例如:我們可以新增 Rigidbody 元件到遊戲物件上,使物件能夠向下掉落。我們也可以新增 Light 元件到遊戲物件上,使它可以發射光線。我們新增 AudioEmitter 元件,可以使遊戲物件發出聲音。
我們實現元件系統的方法並沒有很好地演變。過去我們使用物件導向的思維編寫元件系統,導致元件和遊戲物件都是“大量使用 C++ 程式碼”的物件,建立或銷燬它們需要使用互斥鎖修改“id 到物件指標”的全域性列表。
通過使用面向資料的思維方式,我們可以更好地處理這種情況。我們可以保留使用者眼中的優良特性,即只需新增元件就可以實現功能,而同時通過新元件系統取得出色的效能和並行效果。
這個全新的元件系統就是實體元件系統 ECS。簡單來說,如今我們對遊戲物件進行的操作可用於處理新系統的實體,元件仍稱作元件。那麼區別是什麼?區別在於資料佈局。
ECS 資料佈局
ECS 使用的資料佈局會把這些情況看作一種非常常見的模式,並優化記憶體佈局,使類似操作更加快捷。
原型(Archetype)
ECS 會在記憶體中對帶有相同元件(Component)集的所有實體(Entity)進行組合。ECS 把這類元件集稱為原型(Archetype)。
下圖的原型就是由 Position 元件、Velocity 元件、Rigidbody 元件和 Renderer 元件組成的。
如果一個實體只有三個元件(不同於前面提到的原型),那麼那三個元件就組成了一個新的原型。
下面的圖來自 Unite LA 的一次演講的講義, 很遺憾那次演講沒有錄製下來。講義可以在這裡找到。
ECS 以 16k 大小的塊(Chunk)來分配記憶體,每個塊僅包含單個原型中所有實體的元件資料。
一個帖子中有人提供了更加形象的記憶體佈局圖,例如上半部分的原型由 Position 元件和 Rock 元件組成,其中整個原型佔了一個塊(Chunk),兩個元件的資料分別存在兩個陣列中,裡面還帶著元件資料對應的實體的資訊。
每個原型都有一個 Chunks 塊列表,用來儲存原型的實體。我們會迴圈所有塊,並在每個塊中,對緊湊的記憶體進行線性迴圈處理,以讀取或寫入元件資料。該線性迴圈會對每個實體執行相同的程式碼,同時為 Burst 創造向量化(Vectorization,可以參考 StackOverflow 的問題)處理的機會。
每個塊會被安排好記憶體中的位置,以便於快速從記憶體得到想要的資料,詳情可以參考下面的文章。
Unity2018 ECS框架Entities原始碼解析(二)元件與Chunk的記憶體佈局 - 大鵬的專欄 - CSDN部落格
實體(Entity)
實體是什麼?實體只是一個 32 位的整數 key (和一些額外的資料例如 index 和 version 實體版本,不過在這裡不重要),所以除了實體的元件資料外,不必為實體儲存或分配太多記憶體。實體可以實現遊戲物件的所有功能,甚至更多功能,因為實體非常輕量。
實體的效能消耗很低,所以我們可以把實體用在不適合遊戲物件的情況,例如:為粒子系統內的每個單獨粒子使用一個實體。
實體本身不是物件,也不是一個容器,它的作用是把其元件的資料關聯到一起。
系統(System)
我們不必使用使用者的 Update 方法搜尋元件,然後在執行時對每個例項進行操作,使用 ECS 時我們只需靜態地宣告:我想對同時附帶 Velocity 元件和 Rigidbody 元件的所有實體進行操作。為了找到所有實體,我們只需找到所有符合特定“元件搜尋查詢”的原型即可,而這個過程就是由系統(System)來完成的。
很多情況下,這個過程會分成多個 Job ,使處理 ECS 元件的程式碼達到幾乎 100% 的核心利用率。ECS 會完成所有工作,我們只需要提供對每個實體執行的程式碼即可。我們也可以手動處理塊迭代過程(IJobChunk)。
當我們從實體新增或移除元件時,ECS會切換原型。我們會把它從當前塊移動到新原型的塊,然後交換之前塊的最後實體來“填補空缺”。
在 ECS 中,我們還要靜態宣告要對元件資料進行什麼處理,是 ReadOnly 只讀還是 ReadWrite 讀寫(Job System 一小節提到過的兩種緩衝區)。通過確定僅對 Position 元件進行讀取,ECS 可以更高效地排程 Job ,其它需要讀取 Position 元件的 Job 不必進行等待。
大體上,實體提供純粹的資料給系統,系統根據自己所需要的元件來獲得相應的滿足條件的實體,最後系統再通過多執行緒來基於 Job System 來處理資料。
這種資料佈局也解決了 Unity 長期以來的困擾,即:載入時間和序列化的效能。現在從大型場景載入或流式處理 ECS 資料的時間,不會比從硬碟載入和使用原始位元組多多少。
優點
總的來說,ECS 有以下好處:
- 為效能而生
- 更容易寫出高度優化和可重用的程式碼
- 更能充分利用硬體的效能
- 原型的資料被緊密地排列在記憶體中
- 享受 Burst 編譯器帶來的魔法
缺點
對 ECS 的常見觀點是:ECS 需要編寫很多程式碼。因此,實現想要的功能需要處理很多樣板程式碼。現在針對移除多數樣板程式碼需求的大量改進即將推出,這些改進會使開發者更簡單地表達自己的目的。
Unity 暫時沒有實現太多這類改進,因為 Unity 現在正專注於處理基礎效能。
太多樣板程式碼對 ECS 遊戲程式碼沒有好處,我們不能讓編寫 ECS 程式碼比編寫 MonoBehaviour 更麻煩。 ——Unity
而為網頁遊戲而生的基於 ECS 的 Project Tiny 已經實現了部分改進,例如:基於 lambda 函式的迭代 API。
最後
由於自己空閒時間不多,只能囫圇吞棗地拼湊出這樣一篇筆記。上面大部分文字都是來自 Unity 的博文介紹,自己加了其他的內容幫助理解。本文從記憶體佈局介紹了 ECS 的概念,也介紹了 Job System 和 Burst。我相信走過一遍文章之後,能清楚 Unity 對資料驅動的未來開發趨勢的佈局,也能更加容易從 Unity ECS Sample 中理解如何實踐 ECS。
參考
- Unity DOD (ECS) 基礎概念與資料彙總
- 這篇文章總結得很好,但很多視訊連結都錯了,我提供給了一個改好的版本:DOD 相關文章
- Unity ECS程式設計官方文件選譯--Getting Started
- 面向資料技術棧DOTS之ECS實體元件系統
- On DOTS: Entity Component System - Unity Blog
- On DOTS: C++ & C# - Unity Blog
- ECS Deep Dive
- UniteLA 2018 - ECS deep dive
- Intro To The Entity Component System And C# Job System
- 視訊中程式碼部分已經過時,建議參考 Unity ECS Sample 官方 Demo 來學習 ECS
相關文章
- Microservices==>Service Mesh==>Serverless,走馬觀花ROSServer
- 面試周連續劇之走馬觀花面試
- Python 快速教程(標準庫):走馬觀花Python
- TextView走馬燈TextView
- progressBar走馬燈設定
- 純JS實現走馬燈JS
- 17、Connect-the-dots(VulnHub)
- 小皮球,下腳踢,馬蓮開花JSONPJSON
- 騰訊天美GDC分享:千人同屏戰鬥,Unity DOTS在《重返帝國》中的應用Unity
- 使用 Flutter 實現一個走馬燈佈局Flutter
- Element-Ui元件(四十二)Carousel 走馬燈UI元件
- Unity GDC 2019 Keynote精彩要點:次時代圖形、實時光線追蹤、DOTSUnity
- 程式人生 | 春風得意馬蹄疾,一日看盡長安花
- 帶你走進Oracle資料安全的世界一觀(轉)Oracle
- element-ui Carousel 走馬燈原始碼分析整理筆記(十一)UI原始碼筆記
- 小學數學學習:神奇的走馬燈數 142857
- 花唄套現真的可以走大眾點評等團購的模式嗎?模式
- 世界AI大會三馬縱論:馬雲樂觀、馬斯克悲觀,馬化騰提了個大危害AI馬斯克
- Vue.js+Element-UI走馬燈圖片自適應實踐Vue.jsUI
- “您的主機已被接管!”新型 JavaScript 遠控木馬花樣來襲JavaScript
- 四年裡 | 程式設計師Phodal 與中文女花仲馬程式設計師
- 花小錢、辦大事,2024年Unity遊戲行業趨勢解讀Unity遊戲行業
- 木馬蠕蟲變種走後門 會盜取網遊密碼(轉)密碼
- 網際網路裝潢低價模式顛覆“三觀” 還能走多遠?模式
- 傳智播客黑馬.NET+Unity3D 遊戲開發視訊教程Unity3D遊戲開發
- 資料觀:從經濟大資料看中國房地產歷史走勢分析大資料
- Unity——Js和Unity互相呼叫UnityJS
- 增長點在哪、最花錢是什麼遊戲、出海該往哪走?一文看懂全球遊戲大盤!遊戲
- 專訪馬曉軼:超級數字場景,與騰訊電競產業的未來觀產業
- 開疆作劍,開荒為犁:2022春天,文心大模型走進產業百花深處大模型產業
- 3.24鮮花
- 鮮花#3
- 鮮花#6
- 鮮花 #2
- 鮮花 黑夜
- 鮮花 大道
- [鮮花] ..x?.
- 鮮花 #3