【CUDA學習】__syncthreads的理解

一點心青發表於2013-07-25

__syncthreads()是cuda的內建函式，用於塊內執行緒通訊.

__syncthreads() is you garden variety thread barrier. Any thread reaching the barrier waits until all of the other threads in that block also reach it. It is

designed for avoiding race conditions when loading shared memory, and the compiler will not move memory reads/writes around a __syncthreads().

其中，最重要的理解是那些可以到達__syncthreads()的執行緒需要其他可以到達該點的執行緒，而不是等待塊內所有其他執行緒。

一般使用__syncthreads()程式結構如下：

 1 __share__ val[];
 2 ...
 3 if(index < n)
 4 {    
 5    if(tid condition)    
 6     {         
 7         do something with val;    
 8     }    
 9     __syncthreads();    
10     do something with val;
11     __syncthreads();
12 }

這種結構塊內所有執行緒都會到達__syncthreads()，塊內執行緒同步.

 1 __share__ val[];
 2 ...
 3 if(index < n)
 4 {     
 5     if(tid condition)     
 6     {          
 7         do something with val;
 8         __syncthreads();      
 9     }     
10     else      
11     {         
12         do something with val;
13         __syncthreads();     
14     }
15 }

這種結構將塊內執行緒分成兩部分，每一部分對共享儲存器進行些操作，並在各自部分裡同步.這種結構空易出現的問題是若兩部分都要對某一地址的共享儲存器進行寫操作，將可能出

現最後寫的結果不一致錯誤.要讓錯誤不發生需要使用原子操作.

 1 __share__ val[];
 2 ....
 3 if(index < n)
 4 {      
 5     if(tid condition)      
 6     {          
 7         do something  with val;          
 8         __syncthreads();       
 9     }      
10     do something with val;
11 }

這種結構，塊內只有部分執行緒對共享儲存器做處理，並且部分執行緒是同步.那些不滿足if條件的執行緒，會直接執行後面的語句.若後面的語句裡面和if裡面的語句都對共享儲存器的同一

地址進行寫操作時將會產生wait forever。若沒有這種情況出現，程式則可以正常執行完.

在使用if condition 和__syncthreads()，最好使用第一結構，容易理解，不容易出錯～

CUDA學習指南
2020-10-04
CUDA學習筆記-1: CUDA程式設計概覽
2021-08-04
筆記程式設計
【CUDA學習】共享儲存器
2013-07-25
【CUDA學習】核心程式除錯
2013-07-25
除錯
【CUDA學習】GPU硬體結構
2013-07-25
GPU
【CUDA學習】全域性儲存器
2013-07-25
CUDA 學習筆記之程式棧
2010-04-30
筆記
CUDA 學習筆記之gpu結構
2010-04-30
筆記GPU
CUDA 學習筆記之儲存器
2010-04-30
筆記
CUDA學習筆記之柵欄同步
2010-05-07
筆記
CUDA 學習筆記之向量宣告使用
2010-05-07
筆記
【CUDA學習】結構體指標複製
2013-07-25
結構體指標
CUDA 學習筆記之型別轉換
2010-04-30
筆記型別
沒有英偉達CUDA，深度學習的發展將延遲？
2019-03-29
深度學習
【深度學習】檢測CUDA、cuDNN、Pytorch是否可用
2023-01-17
深度學習DNNPyTorch
CUDA學習筆記之變數限制符
2010-05-07
筆記變數
CUDA 學習筆記之函式限制符
2010-05-07
筆記函式
JS 的學習理解--->變數
2019-07-20
JS變數
JS的學習理解--->函式
2019-07-20
JS函式
【深度學習】PyTorch CUDA環境配置及安裝
2021-04-19
深度學習PyTorch
深度學習框架火焰圖pprof和CUDA Nsys配置指南
2024-05-08
深度學習框架
學習理解篇1
2024-05-07
CUDA C 程式設計權威指南學習筆記：第二章 CUDA程式設計模型
2018-03-02
程式設計筆記模型
cuda矩陣練習（一）
2019-05-14
矩陣
記一次C#使用Onnx深度學習下呼叫Cuda的方法
2024-04-03
C#深度學習
深入學習和理解 Redux
2020-03-05
Redux
深入理解深度學習
2020-11-14
深度學習
深度學習淺層理解
2017-09-10
深度學習
Flex 佈局：個人的學習與理解
2019-03-07
Flex
SQLServer學習筆記 - 主鍵的理解
2020-10-08
SQLServer筆記
oracle例項恢復的學習理解
2015-04-04
Oracle
對checkpoint的理解一文的學習
2008-04-29
CUDA10.0官方文件的翻譯與學習之程式設計介面
2020-12-12
程式設計
讓 PM 全面理解深度學習
2019-08-07
深度學習
batch normalization學習理解筆記
2019-06-09
BATORM筆記
Java學習之Math類理解
2017-07-31
Java
Java學習之File類理解
2017-08-01
Java
Java學習之理解遞迴
2017-08-01
Java遞迴

【CUDA學習】__syncthreads的理解

相關文章