【CUDA學習】全域性儲存器

一點心青發表於2013-07-25

全域性儲存器，即普通的視訊記憶體，整個網格中的任意執行緒都能讀寫全域性儲存器的任意位置。

存取延時為400-600 clock cycles 非常容易成為效能瓶頸。

訪問視訊記憶體時，讀取和儲存必須對齊，寬度為4Byte。如果沒有正確的對齊，讀寫將被編譯器拆分為多次操作，降低訪存效能。

多個half-warp的讀寫操作如果能夠滿足合併訪問，則多次訪存操作會被合併成一次完成。

合併訪問的條件，GT200放寬了合併訪問的條件。

支援對8 bit、16 bit、32 bit、64 bit資料字的合併訪問　相應傳輸32Byte 64Byte 128Byte，大於128Byte，分兩次傳輸。

在一次合併傳輸的資料中，不要求執行緒編號和訪問的資料字編號相同。

當訪問128Byte資料時，如果地址沒有對齊到128Byte時，在GT200會產生兩次合併訪存。根據每個區域的大小，分為兩次合併訪存，如圖所示32Byte和96Byte。

PS:圖片來源於網上

關於訪存合併以及訪存衝突，關鍵就是要理解，GPU是以half-warp進行訪存時，即16個執行緒一起訪問儲存器，到這16個執行緒的訪問的地址在同一塊區域（指硬體上可以一起傳送寬

度）時，並且沒有衝突產生時，則這塊區域的資料可以被執行緒同時，提升了訪存的效率.

【CUDA學習】共享儲存器
2013-07-25
CUDA 學習筆記之儲存器
2010-04-30
筆記
全域性儲存器優化
2010-06-03
優化
CUDA儲存器組織
2010-02-07
cuda優化之常量儲存器和紋理儲存器
2010-06-25
優化
儲存學習
2020-10-20
[譯]在CUDA C/C++中使用共享儲存器
2019-05-10
C++
Vue註冊的全域性元件配置物件儲存的位置
2022-05-09
Vue元件物件
儲存學習之開源儲存軟體
2014-07-17
CUDA學習指南
2020-10-04
非易失性儲存器EEPROM
2020-12-11
oracle 儲存過程學習
2014-07-02
Oracle儲存過程
儲存過程學習教材
2014-07-01
儲存過程
Oracle儲存過程學習
2008-07-21
Oracle儲存過程
【Mysql 學習】memory儲存引擎
2011-01-05
MySql儲存引擎
【Mysql 學習】Mysql 儲存引擎
2011-01-05
MySql儲存引擎
非易失性儲存器平衡方法
2020-09-11
MySQL學習之全域性鎖和表鎖
2021-02-08
MySql
Spark 儲存模組原始碼學習
2020-03-22
Spark原始碼
Pytorch學習（七）---- 儲存提取
2020-12-19
PyTorch
【Mysql】Mysql儲存過程學習
2016-02-24
MySql儲存過程
【Mysql 學習】MyISAM儲存引擎(二)。
2011-01-05
MySql儲存引擎
【Mysql 學習】MyISAM儲存引擎(一)。
2011-01-05
MySql儲存引擎
學習筆記14：模型儲存
2024-06-04
筆記模型
Vue3全域性APi解析-原始碼學習
2021-06-30
VueAPI原始碼
python學習筆記區域性和全域性作用域
2019-03-20
Python筆記
【儲存管理】SAN儲存 Storage Area Network 儲存區域網路學習筆記
2014-08-01
筆記
儲存器
2024-03-30
Mysql 5.7儲存過程的學習
2019-07-31
MySql儲存過程
GlusterFS分散式儲存學習筆記
2018-04-03
分散式筆記
Hibernate學習（二）儲存資料
2016-10-16
OS學習筆記五：儲存模型
2017-10-07
筆記模型
【Mysql學習】MERGE儲存引擎(一)
2016-04-15
MySql儲存引擎
學習Oracle的索引、表的儲存
2008-07-20
Oracle索引
儲存學習的一點路線
2009-02-25
【Mysql 學習】MERGE儲存引擎(一)
2011-01-05
MySql儲存引擎
易失性儲存器SRAM基礎知識
2020-12-04
CUDA學習筆記-1: CUDA程式設計概覽
2021-08-04
筆記程式設計

【CUDA學習】全域性儲存器

相關文章