cuda優化之常量儲存器和紋理儲存器
3.5
常量儲存器優化
CUDA 允許分配最多64KB的常量儲存器,常量儲存器顧名思義內容是不變的,所以也有人稱其為不變儲存器。每個SM有6-8KB的常量快取,一般而言一到兩個週期可讀取常量儲存器。如果半束內的執行緒訪問的不是同一個地址,那麼各個執行緒的訪問將會序列化。
常量儲存器的設計個人認為不是太好,有點像雞肋。因為要求常量儲存器是全域性的,因此對程式的可讀性和可擴充套件性都有影響。
對於常量儲存器大小的限制問題,有些情況下,可以使用多次匯入並多次執行核心的方式解決。
3.6 紋理儲存器
紋理儲存器是來自圖形學的一個概念。由於硬體的支援,提供了很多額外處理功能,如邊界處理、濾波等。訪問紋理儲存器要通過紋理參考和紋理獲取。
CUDA對於隨機存取的效能極其的悲劇,而紋理儲存器可減弱這種悲劇的效果,尤其是訪問的資料之間具有極大的區域性性的時候。
另外在某些情況下可以利用紋理的插值功能來加速計算。此時要注意的紋理執行的是低精度的線性插值。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23057064/viewspace-666277/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 傳統儲存器和新興儲存器應用
- 儲存器
- Flutter持久化儲存之檔案儲存Flutter持久化
- 主儲存器
- 外部儲存器
- [譯]在CUDA C/C++中使用共享儲存器C++
- Flutter持久化儲存之資料庫儲存Flutter持久化資料庫
- Flutter持久化儲存之key-value儲存Flutter持久化
- 《MySQL 效能優化》之 InnoDB 儲存引擎MySql優化儲存引擎
- 儲存器、I/O組織、微處理器
- 前端基於瀏覽器儲存的AJAX效能優化前端瀏覽器優化
- 鐵電儲存器FRAM的優劣勢
- 20932虛擬儲存器
- 只讀儲存器ROM
- 儲存器的知識
- 高速率儲存器UFS
- oracle儲存過程和觸發器Oracle儲存過程觸發器
- 嵌入式中常見的儲存器總結(一)儲存器分類
- MySQL優化---儲存過程和儲存函式-1-轉自部落格園MySql優化儲存過程儲存函式
- 滴滴Ceph分散式儲存系統優化之鎖優化分散式優化
- 淺談儲存器的進化歷程
- Fujitsu鐵電儲存器(FRAM)技術優點
- 塊儲存 檔案儲存 物件儲存物件
- 儲存服務質量優化優化
- 小談mysql儲存引擎優化MySql儲存引擎優化
- Hive的壓縮儲存和簡單優化Hive優化
- Android-內部儲存和外部儲存Android
- SRAM是什麼儲存器
- Flash儲存器的故障特徵特徵
- 常見儲存器分類
- 瀏覽器儲存的方法瀏覽器
- Impala之儲存和壓縮
- 資料儲存(1):從資料儲存看人類文明-資料儲存器發展歷程
- 騰訊雲物件儲存COS新品釋出——智慧分層儲存,自動優化您的儲存成本物件優化
- 儲存—物件儲存_Minio物件
- 使用紋理的RGBA通道儲存float型別數值型別
- 伺服器儲存空間不足怎麼處理?伺服器
- 如何延長儲存伺服器上資料的儲存時間?伺服器
- Android中的資料儲存之檔案儲存Android