CUDA 學習筆記之gpu結構
一個gpu裡面的處理單元以stream multiprocesser來組織,一個流多處理器有八個流處理器,二個特殊函式處理單元,16K的shared memory,64K的constant memory,一些指令分發快取單元。
線上程的分配中,一個block被對映到一個多處理器上,塊內的最多執行緒數目前限制為512,一般而言每個塊內128/256個執行緒是比較好的。定義塊的個數在128/64,這個和你的硬體有很大關係,比如如果你有50個多處理器,你定義的塊數量最好是50的倍數。執行時是以warp為單位的,現在每個warp裡有32個執行緒,因此要四個週期一個多處理器就能夠處理完一個warp塊。每個warp裡的所有執行緒執行同一條指令,warp內的執行緒執行分支會顯著的降低效能,但不是所有的分支。
對於處理器分宿主和裝置,其中宿主是指cpu,一般宿主控制裝置,宿主執行序列部分,裝置執行並行部分。宿主執行裝置驅動,而裝置驅動是由執行時控制的,而執行時依據庫,cuda主要有兩個數學庫:cufft和cublabs。這兩個庫很高階,應掌握。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22785983/viewspace-661685/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- CUDA學習筆記-1: CUDA程式設計概覽筆記程式設計
- GO 學習筆記->結構體Go筆記結構體
- 資料結構學習筆記資料結構筆記
- 結構動力學教材-學習筆記筆記
- 資料結構學習筆記1資料結構筆記
- Oracle體系結構學習筆記Oracle筆記
- 資料結構學習筆記--棧資料結構筆記
- jQuery 學習筆記:jQuery 程式碼結構jQuery筆記
- 結構化程式設計--學習筆記程式設計筆記
- 資料結構學習筆記-堆排序資料結構筆記排序
- 《資料結構與演算法之美》學習筆記之開篇資料結構演算法筆記
- Java學習筆記:資料結構之線性表(雙向連結串列)Java筆記資料結構
- 《資料結構與演算法之美》學習筆記之複雜度資料結構演算法筆記複雜度
- 資料結構——並查集 學習筆記資料結構並查集筆記
- 2.1資料結構學習筆記--佇列資料結構筆記佇列
- Go 筆記之程式結構Go筆記
- 安卓學習筆記---開篇(目錄結構)安卓筆記
- Solidity語言學習筆記————15、結構體StructSolid筆記結構體Struct
- [學習筆記] Splay & Treap 平衡樹 - 資料結構筆記資料結構
- 資料結構學習筆記-佛洛依德演算法資料結構筆記演算法
- OpenXml SDK學習筆記(1):Word的基本結構XML筆記
- Laravel8學習筆記01 - 目錄結構Laravel筆記
- React學習筆記之雙向資料繫結React筆記
- 資料結構學習之樹結構資料結構
- 資料結構和演算法-學習筆記(一)資料結構演算法筆記
- 資料結構與演算法-學習筆記(二)資料結構演算法筆記
- 資料結構與演算法-學習筆記(16)資料結構演算法筆記
- 資料結構與演算法學習筆記01資料結構演算法筆記
- Python 學習筆記-03-01-三大結構-分支Python筆記
- 資料結構學習筆記-先序遍歷森林資料結構筆記
- 資料結構學習筆記-遞迴求解森林高度資料結構筆記遞迴
- 資料結構 第二章(學習筆記一)資料結構筆記
- C語言學習筆記:結構體與指標C語言筆記結構體指標
- Go語言學習筆記 - PART7 - 結構體Go筆記結構體
- 資料結構——李超線段樹 學習筆記資料結構筆記
- 資料結構學習筆記-簡單選擇排序資料結構筆記排序
- Redis學習筆記(二)redis 底層資料結構Redis筆記資料結構
- 學習筆記之測試筆記
- JS學習筆記之this指向JS筆記