GPU硬體結構
【原文:https://www.cnblogs.com/dwdxdy/p/3215158.html】
GPU的硬體結構,也不是具體的硬體結構,就是與CUDA相關的幾個概念:thread,block,grid,warp,sp,sm。
sp: 最基本的處理單元,streaming processor 最後具體的指令和任務都是在sp上處理的。GPU進行平行計算,也就是很多個sp同時做處理
sm:多個sp加上其他的一些資源組成一個sm, streaming multiprocessor. 其他資源也就是儲存資源,共享記憶體,寄儲器等。
warp:GPU執行程式時的排程單位,目前cuda的warp的大小為32,同在一個warp的執行緒,以不同資料資源執行相同的指令。
grid、block、thread:在利用cuda進行程式設計時,一個grid分為多個block,而一個block分為多個thread.其中任務劃分到是否影響最後的執行效果。劃分的依據是任務特性和
GPU本身的硬體特性。
下面幾張硬體結構簡圖 便於理解(圖片來源於網上)
以上兩圖可以清晰地表示出sm與sp的關係。
此圖反應了warp作為排程單位的作用,每次GPU排程一個warp裡的32個執行緒執行同一條指令,其中各個執行緒對應的資料資源不同。
上圖是一個warp排程的例子。
一個sm只會執行一個block裡的warp,當該block裡warp執行完才會執行其他block裡的warp。
進行劃分時,最好保證每個block裡的warp比較合理,那樣可以一個sm可以交替執行裡面的warp,從而提高效率,此外,在分配block時,要根據GPU的sm個數,分配出合理的
block數,讓GPU的sm都利用起來,提利用率。分配時,也要考慮到同一個執行緒block的資源問題,不要出現對應的資源不夠。
相關文章
- 硬體加速gpu計劃開還是不開 win10硬體加速gpu計劃有用嗎GPUWin10
- FPGA內部硬體結構簡介FPGA
- GPU體系架構(二):GPU儲存體系GPU架構
- Android硬體加速(二)-RenderThread與OpenGL GPU渲染AndroidthreadGPU
- PS5詳細硬體架構公佈:極速SSD與全新GPU架構GPU
- win10硬體加速沒有gpu計劃 強制開啟win10硬體加速gpu計劃的方法Win10GPU
- powerVR tbdr 硬體架構理解VR架構
- QT硬體異構計算QT
- Windows10系統中edge怎麼設定硬體加速GPUWindowsGPU
- 結構體中套用其他_結構體結構體
- 從軟體(Java/hotspot/Linux)到硬體(硬體架構)分析互斥操作的本質JavaHotSpotLinux架構
- VMware ESXi安裝NVIDIA GPU顯示卡硬體驅動和配置vGPUGPU
- 結構體結構體
- 如何用 GPU硬體層加速優化Android系統的遊戲流暢度GPU優化Android遊戲
- Go 結構體Go結構體
- LightGCN實踐2——GPU記憶體爆炸終結篇GCGPU記憶體
- 結構體與共用體結構體
- 伺服器的硬體配置構成有哪些?伺服器
- 3:Oracle體系結構(邏輯結構)Oracle
- ads1292硬體電路除錯總結除錯
- GPU深度學習效能的三駕馬車:Tensor Core、記憶體頻寬與記憶體層次結構GPU深度學習記憶體
- 【PG體系結構】PG體系結構簡單說明
- 已知結構體成員地址獲取結構體首地址結構體
- Deployer整體結構
- MySQL 體系結構MySql
- 【JVM體系結構】JVM
- 結構體學習結構體
- 結構體問題結構體
- BeanFactory體系結構Bean
- MongoDB 體系結構MongoDB
- JVM - 整體結構JVM
- 類與結構體結構體
- 記憶體結構記憶體
- FFmpeg結構體:AVOutputFormat結構體ORM
- 結構體的大小結構體
- 16-結構體結構體
- Servlet 體系結構Servlet
- 結構體相關結構體