CUDA常用函式介紹

yyfn風辰發表於2010-04-21

原文網址 : http://blog.itpub.net/23057064/viewspace-660373/

cudaMalloc(void** p, int size):分配size位元組的儲存器，並將其首地址賦給＊ｐ，至於引數為什麼是二級指標，可在Ｃ語言中找到答案

cudaMallocHost():這個方法是在主機上分配空間，可以加快傳輸速度，因此在寫cuda時，應該使用此函式取代Malloc，引數同上一函式

cudaMemcpy(void* dest,void* source,int size,enum direction):copy size data form. source to dest,direction must be right,you must be careful。關於這個函式要注意的是：如果最後一個引數的型別不匹配也不會出錯。

cudaMemcpyToSymbol：將資料複製到__constant__，__device__變數中
cudaMemcpyFormSymbol: 同上相反

CudaThreadSynchronize():強制等待所有在此句之前啟動的runtime 任務完成。其實現方式採用的輪詢。

__syncthreads():此函式用於保證block內所有執行緒都執行到呼叫處，常用它來保證一致性。

cudaMallocPitch(void**,int*,widthInBytes,height):這個函式是線上性記憶體中分配二維陣列，因此在使用時，還是用一維的方式使用。注意，width的單位是位元組，而height單位是資料型別，而第二個引數的含義下面一段話說明了。
c語言申請2維記憶體時，一般是連續存放的。a[y][x]存放在第y*widthofx*sizeof(元素)+x*sizeof(元素)個位元組。但在cuda的global memory訪問中，從256位元組對齊的地址(addr=0, 256, 512, ...)開始的連續訪問是最有效率的。這樣，為了提高記憶體訪問的效率，有了cudaMallocPitch函式。cudaMallocPitch函式分配的記憶體中，陣列的每一行的第一個元素的開始地址都保證是對齊的。因為每行有多少個資料是不確定的，widthofx*sizeof(元素)不一定是256的倍數。故此，為保證陣列的每一行的第一個元素的開始地址對齊，cudaMallocPitch在分配記憶體時，每行會多分配一些位元組，以保證widthofx*sizeof(元素)+多分配的位元組是256的倍數(對齊)。這樣，上面的y*widthofx*sizeof(元素)+x*sizeof(元素)來計算a[y][x]的地址就不正確了。而應該是y*[widthofx*sizeof(元素)+多分配的位元組]+x*sizeof(元素)。而函式中返回的pitch的值就是widthofx*sizeof(元素)+多分配的位元組。說明：widthInBytes作為輸入引數，應該是widthofx*sizeof(元素)；這樣的話，複製內容時也要作相應的修改。

cuda中的數學函式，普通的和標準c中一樣，如果是對int操作，直接使用本名，如果操作long型別對數，在本名前加l，如果操作雙精度浮點數，在本名前加f，如果操作單精度，在本名前後都加上f，如 max(int,int)，lmax(long,long),fmax(double,double),fmaxf(float,float),同時要記住的是：有些函式並沒有某些型別引數存在，也就沒有相應的函式。

向量操作

cuda對於向量在cutil_math.h中過載了很多操作符，如負號，+， -， *(包括向量乘和數乘），/（向量的對應座標相除和數除），+=，-=，*=，lerp（三個引數，含義為求一個值，使得該值和第一個引數的距離與每一個引數和第二個引數的距離的比值是第三個引數，型別於高中的線段的分割點）， dot(點乘)，length（返回二範數），normalize（對向量進行單位化），rsqrtf（求開方的倒數）

[ 本帖最後由 yyfn風辰於 2010-4-21 21:14 編輯 ]

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/23057064/viewspace-660373/，如需轉載，請註明出處，否則將追究法律責任。

cuda函式庫介紹
2024-05-25
函式
oracle常用函式介紹
2018-10-21
Oracle函式
Hive的基本介紹以及常用函式
2020-06-04
Hive函式
einsum函式介紹-張量常用操作
2022-05-08
函式
Tensorflow教程（2）Tensorflow的常用函式介紹
2019-07-14
函式
介紹4個大神常用而你不常用的python函式
2018-11-08
Python函式
Python資料分析--Numpy常用函式介紹(3)
2022-05-23
Python函式
Python資料分析--Numpy常用函式介紹(2)
2022-05-21
Python函式
stoi函式介紹
2024-11-16
函式
cuda 核函式
2024-03-09
函式
funclib函式庫介紹
2018-07-31
函式
CUDA記憶體介紹
2020-12-07
記憶體
Python資料分析--Numpy常用函式介紹(7)--Numpy中矩陣和通用函式
2022-06-08
Python函式矩陣
Python資料分析--Numpy常用函式介紹(5)--Numpy中的相關性函式
2022-06-01
Python函式
【重溫基礎】JS中的常用高階函式介紹
2019-02-16
JS函式
javascript函式中with的介紹
2018-10-26
JavaScript函式
Dart建構函式介紹
2019-07-30
Dart函式
快速介紹幾個JS函式
2019-02-27
JS函式
ES6 Generator 函式介紹
2020-05-27
函式
原創：oracle聚合函式介紹
2020-04-06
Oracle函式
javascript中generator函式的介紹
2021-09-11
JavaScript函式
javascript高階函式的介紹
2021-09-11
JavaScript函式
大模型推理框架llama.cpp開發流程和常用函式介紹
2024-10-05
大模型框架函式
簡單介紹JS函式防抖和函式節流
2021-05-28
JS函式
Python 偏函式介紹及應用
2020-05-26
Python函式
Python之函式的相關介紹
2021-09-11
Python函式
Angular 14 新的 inject 函式介紹
2022-11-06
Angular函式
機器學習基本函式介紹
2020-12-05
機器學習函式
常用正規表示式匹配程式碼介紹
2022-03-20
用大白話介紹柯里化函式
2019-04-14
函式
函式中的apply,call入門介紹
2019-03-29
函式APP
Go函式介紹與一等公民
2023-10-14
Go函式
SparkSQL介紹並實現開窗函式
2020-04-12
SparkSQL函式
python 介紹一個很好用的函式
2020-04-15
Python函式
Python 內建函式:——locals 和 globals介紹
2020-04-23
Python函式
R語言kohonen包主要函式介紹
2020-04-20
R語言函式
Mysql 常用函式（1）- 常用函式彙總
2020-05-14
MySql函式
match函式簡單介紹以及與index函式結合應用
2018-08-20
函式Index
雜篇：Android繪製函式圖象及正弦函式的介紹
2019-01-02
Android函式

CUDA常用函式介紹

相關文章