cuda優化之常量儲存器和紋理儲存器
3.5
常量儲存器優化
CUDA 允許分配最多64KB的常量儲存器,常量儲存器顧名思義內容是不變的,所以也有人稱其為不變儲存器。每個SM有6-8KB的常量快取,一般而言一到兩個週期可讀取常量儲存器。如果半束內的執行緒訪問的不是同一個地址,那麼各個執行緒的訪問將會序列化。
常量儲存器的設計個人認為不是太好,有點像雞肋。因為要求常量儲存器是全域性的,因此對程式的可讀性和可擴充套件性都有影響。
對於常量儲存器大小的限制問題,有些情況下,可以使用多次匯入並多次執行核心的方式解決。
3.6 紋理儲存器
紋理儲存器是來自圖形學的一個概念。由於硬體的支援,提供了很多額外處理功能,如邊界處理、濾波等。訪問紋理儲存器要通過紋理參考和紋理獲取。
CUDA對於隨機存取的效能極其的悲劇,而紋理儲存器可減弱這種悲劇的效果,尤其是訪問的資料之間具有極大的區域性性的時候。
另外在某些情況下可以利用紋理的插值功能來加速計算。此時要注意的紋理執行的是低精度的線性插值。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23057064/viewspace-666277/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- CUDA儲存器組織
- CUDA 學習筆記之儲存器筆記
- 共享儲存器優化優化
- 【CUDA學習】共享儲存器
- CUDA優化之執行配置和暫存器優化優化
- 全域性儲存器優化優化
- 【CUDA學習】全域性儲存器
- 傳統儲存器和新興儲存器應用
- 儲存器
- Flutter持久化儲存之檔案儲存Flutter持久化
- [譯]在CUDA C/C++中使用共享儲存器C++
- Flutter持久化儲存之key-value儲存Flutter持久化
- Flutter持久化儲存之資料庫儲存Flutter持久化資料庫
- 《MySQL 效能優化》之 InnoDB 儲存引擎MySql優化儲存引擎
- 儲存器、I/O組織、微處理器
- 華為伺服器和華為儲存伺服器
- 前端基於瀏覽器儲存的AJAX效能優化前端瀏覽器優化
- 加大對儲存器國產化的投入
- MySQL 效能優化之儲存引擎選擇MySql優化儲存引擎
- 鐵電儲存器FRAM的優劣勢
- 高速率儲存器UFS
- 瀏覽器本地儲存瀏覽器
- 程式儲存器的分段
- 自動儲存、靜態儲存和動態儲存
- oracle儲存過程和觸發器Oracle儲存過程觸發器
- 嵌入式中常見的儲存器總結(一)儲存器分類
- 淺談儲存器的進化歷程
- MySQL優化---儲存過程和儲存函式-1-轉自部落格園MySql優化儲存過程儲存函式
- 滴滴Ceph分散式儲存系統優化之鎖優化分散式優化
- SRAM是什麼儲存器
- 常見儲存器分類
- Flash儲存器的故障特徵特徵
- 瀏覽器儲存的方法瀏覽器
- [嵌入式]儲存器管理
- FastDFS儲存伺服器部署AST伺服器
- 儲存服務質量優化優化
- 小談mysql儲存引擎優化MySql儲存引擎優化
- Hive的壓縮儲存和簡單優化Hive優化