CUDA 學習筆記之gpu結構
一個gpu裡面的處理單元以stream multiprocesser來組織,一個流多處理器有八個流處理器,二個特殊函式處理單元,16K的shared memory,64K的constant memory,一些指令分發快取單元。
線上程的分配中,一個block被對映到一個多處理器上,塊內的最多執行緒數目前限制為512,一般而言每個塊內128/256個執行緒是比較好的。定義塊的個數在128/64,這個和你的硬體有很大關係,比如如果你有50個多處理器,你定義的塊數量最好是50的倍數。執行時是以warp為單位的,現在每個warp裡有32個執行緒,因此要四個週期一個多處理器就能夠處理完一個warp塊。每個warp裡的所有執行緒執行同一條指令,warp內的執行緒執行分支會顯著的降低效能,但不是所有的分支。
對於處理器分宿主和裝置,其中宿主是指cpu,一般宿主控制裝置,宿主執行序列部分,裝置執行並行部分。宿主執行裝置驅動,而裝置驅動是由執行時控制的,而執行時依據庫,cuda主要有兩個數學庫:cufft和cublabs。這兩個庫很高階,應掌握。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22785983/viewspace-661685/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【CUDA學習】GPU硬體結構GPU
- CUDA 學習筆記之程式棧筆記
- CUDA 學習筆記之儲存器筆記
- CUDA學習筆記之柵欄同步筆記
- CUDA 學習筆記之向量宣告使用筆記
- CUDA 學習筆記之型別轉換筆記型別
- CUDA學習筆記之變數限制符筆記變數
- CUDA 學習筆記之函式限制符筆記函式
- bootstrap 學習筆記之 文件結構不能變boot筆記
- CUDA學習筆記-1: CUDA程式設計概覽筆記程式設計
- Go 結構 學習筆記Go筆記
- Symfony2學習筆記之目錄結構筆記
- GO 學習筆記->結構體Go筆記結構體
- 資料結構學習筆記資料結構筆記
- 【CUDA學習】結構體指標複製結構體指標
- 記下原來學習Oracle的筆記之——體系結構Oracle筆記
- Oracle體系結構學習筆記Oracle筆記
- 資料結構學習筆記--棧資料結構筆記
- 資料結構學習筆記1資料結構筆記
- ASM學習筆記_體系結構ASM筆記
- MySQL學習筆記之命令總結MySql筆記
- 結構化程式設計--學習筆記程式設計筆記
- 【C#學習筆記】結構體使用C#筆記結構體
- jQuery 學習筆記:jQuery 程式碼結構jQuery筆記
- DG學習筆記(2)_體系結構筆記
- 資料結構學習筆記(一) (轉)資料結構筆記
- 《資料結構與演算法之美》學習筆記之開篇資料結構演算法筆記
- 安卓學習筆記---開篇(目錄結構)安卓筆記
- 2.1資料結構學習筆記--佇列資料結構筆記佇列
- Hive學習筆記 1 Hive體系結構Hive筆記
- Object C學習筆記20-結構體Object筆記結構體
- 學習筆記:InnoDB表和索引結構(二)筆記索引
- 學習筆記:InnoDB表和索引結構(一)筆記索引
- Java學習筆記:資料結構之線性表(雙向連結串列)Java筆記資料結構
- 架構學習筆記架構筆記
- 《資料結構與演算法之美》學習筆記之複雜度資料結構演算法筆記複雜度
- Go 筆記之程式結構Go筆記
- OpenXml SDK學習筆記(1):Word的基本結構XML筆記