【CUDA學習】GPU硬體結構

一點心青發表於2013-07-25

GPU

GPU的硬體結構，也不是具體的硬體結構，就是與CUDA相關的幾個概念：thread，block，grid，warp，sp，sm。

sp: 最基本的處理單元，streaming processor 最後具體的指令和任務都是在sp上處理的。GPU進行平行計算，也就是很多個sp同時做處理

sm:多個sp加上其他的一些資源組成一個sm, streaming multiprocessor. 其他資源也就是儲存資源，共享記憶體，寄儲器等。

warp:GPU執行程式時的排程單位，目前cuda的warp的大小為32，同在一個warp的執行緒，以不同資料資源執行相同的指令。

grid、block、thread：在利用cuda進行程式設計時，一個grid分為多個block，而一個block分為多個thread.其中任務劃分到是否影響最後的執行效果。劃分的依據是任務特性和

GPU本身的硬體特性。

下面幾張硬體結構簡圖便於理解(圖片來源於網上）

以上兩圖可以清晰地表示出sm與sp的關係。

此圖反應了warp作為排程單位的作用，每次GPU排程一個warp裡的32個執行緒執行同一條指令，其中各個執行緒對應的資料資源不同。

上圖是一個warp排程的例子。

一個sm只會執行一個block裡的warp，當該block裡warp執行完才會執行其他block裡的warp。

進行劃分時，最好保證每個block裡的warp比較合理，那樣可以一個sm可以交替執行裡面的warp，從而提高效率，此外，在分配block時，要根據GPU的sm個數，分配出合理的

block數，讓GPU的sm都利用起來，提利用率。分配時，也要考慮到同一個執行緒block的資源問題，不要出現對應的資源不夠。

CUDA 學習筆記之gpu結構
2010-04-30
筆記GPU
GPU硬體結構
2018-08-28
GPU
【CUDA學習】結構體指標複製
2013-07-25
結構體指標
結構體學習
2024-04-20
結構體
學習Rust 結構體
2020-12-06
Rust結構體
CUDA學習指南
2020-10-04
cuda程式設計與gpu平行計算（六）：圖稀疏矩陣轉為CSR結構並傳入gpu
2021-01-04
程式設計GPU矩陣
GO 學習筆記->結構體
2020-01-10
Go筆記結構體
Golang 學習——結構體 struct (一)
2020-05-05
Golang結構體Struct
Golang 學習——結構體 struct (二)
2020-05-05
Golang結構體Struct
go語言學習-結構體
2018-03-25
Go結構體
有Cuda能力的GPU核心
2024-06-04
GPU
硬體加速gpu計劃開還是不開 win10硬體加速gpu計劃有用嗎
2022-05-26
GPUWin10
NVIDIA GPU結構
2010-03-11
GPU
8. CUDA 記憶體使用 global 二------GPU的革命
2009-11-17
記憶體GPU
struct 結構體 -Go 學習記錄
2019-03-15
Struct結構體Go
Oracle體系結構學習筆記
2019-05-08
Oracle筆記
golang 學習之路之 struct 結構體
2018-09-07
GolangStruct結構體
JVM學習（一）——記憶體結構
2019-01-10
JVM記憶體
ARM學習之中斷體系結構
2017-08-20
ASM學習筆記_體系結構
2010-05-17
ASM筆記
GPU體系架構(二)：GPU儲存體系
2019-06-14
GPU架構
FPGA內部硬體結構簡介
2019-05-08
FPGA
NVDIA CUDA ---------GPU計算的革命
2010-01-28
GPU
關於結構體型別的學習
2019-07-25
結構體型別
【C#學習筆記】結構體使用
2017-08-27
C#筆記結構體
ARM學習之時鐘體系結構
2017-08-20
DG學習筆記(2)_體系結構
2010-03-19
筆記
GPU深度學習效能的三駕馬車：Tensor Core、記憶體頻寬與記憶體層次結構
2023-12-04
GPU深度學習記憶體
CUDA（五）用deviceQuery看GPU屬性
2016-08-22
devGPU
PS5詳細硬體架構公佈：極速SSD與全新GPU
2020-03-19
架構GPU
win10硬體加速沒有gpu計劃強制開啟win10硬體加速gpu計劃的方法
2022-01-24
Win10GPU
CUDA學習筆記-1: CUDA程式設計概覽
2021-08-04
筆記程式設計
Hive學習筆記 1 Hive體系結構
2017-10-08
Hive筆記
Object C學習筆記20-結構體
2014-03-26
Object筆記結構體
Linux核心學習—— 1核心體系結構
2024-08-07
Linux
【CUDA學習】__syncthreads的理解
2013-07-25
thread
【CUDA學習】共享儲存器
2013-07-25

【CUDA學習】GPU硬體結構

相關文章