caffe中各種cblas的函式使用總結

時光碎了天發表於2020-04-04

原文網址 : https://blog.csdn.net/u013289254/article/details/70228116

轉自：http://www.cnblogs.com/huashiyiqike/p/3886670.html 和http://blog.sina.com.cn/s/blog_4a03c0100101ethf.html

Y=alpha * X +beta*Y

template <>
void caffe_cpu_axpby<float>(const int N, const float alpha, const float* X,
                            const float beta, float* Y) {
  cblas_saxpby(N, alpha, X, 1, beta, Y, 1);
}

template <>
void caffe_cpu_axpby<double>(const int N, const double alpha, const double* X,
                             const double beta, double* Y) {
  cblas_daxpby(N, alpha, X, 1, beta, Y, 1);
}

cblas_dscal(N, beta, Y, incY);  Y=Y*beta 
cblas_daxpy(N, alpha, X, incX, Y, incY);  Y= (alpha * X) + Y)

Y=alpha * X + Y

template <>
void caffe_axpy<float>(const int N, const float alpha, const float* X,
    float* Y) { cblas_saxpy(N, alpha, X, 1, Y, 1); }

template <>
void caffe_axpy<double>(const int N, const double alpha, const double* X,
    double* Y) { cblas_daxpy(N, alpha, X, 1, Y, 1); }

DEFINE_VSL_BINARY_FUNC(Add, y[i] = a[i] + b[i]);
DEFINE_VSL_BINARY_FUNC(Sub, y[i] = a[i] - b[i]);
DEFINE_VSL_BINARY_FUNC(Mul, y[i] = a[i] * b[i]);
DEFINE_VSL_BINARY_FUNC(Div, y[i] = a[i] / b[i]);

template <>
void caffe_add<float>(const int n, const float* a, const float* b,
float* y) {
vsAdd(n, a, b, y);
}

template <>
void caffe_add<double>(const int n, const double* a, const double* b,
double* y) {
vdAdd(n, a, b, y);
}

y=x;

template <>
void caffe_copy<float>(const int N, const float* X, float* Y) {
  cblas_scopy(N, X, 1, Y, 1);
}

template <>
void caffe_copy<double>(const int N, const double* X, double* Y) {
  cblas_dcopy(N, X, 1, Y, 1);
}

template <>
void caffe_gpu_copy<float>(const int N, const float* X, float* Y) {
  CUBLAS_CHECK(cublasScopy(Caffe::cublas_handle(), N, X, 1, Y, 1));
}

template <>
void caffe_gpu_copy<double>(const int N, const double* X, double* Y) {
  CUBLAS_CHECK(cublasDcopy(Caffe::cublas_handle(), N, X, 1, Y, 1));
}

Computes alpha*x*y' + A.

cblas_sger
Multiplies vector X by the transform of vector Y, then adds matrix A (single precison).

Multiplies vector X by the transform of vector Y, then adds matrix A (single precison).
void cblas_sger (
const enum CBLAS_ORDER Order,
const int M,
const int N,
const float alpha,
const float *X,
const int incX,
const float *Y,
const int incY,
float *A,
const int lda
);

Y(vetor)←αAX + βY

This function multiplies A * X (after transposing A, if needed) and multiplies the resulting matrix by alpha. It then multiplies vector Y by beta. It stores the sum of these two products in vector Y.

template <>
void caffe_cpu_gemv<float>(const CBLAS_TRANSPOSE TransA, const int M,
    const int N, const float alpha, const float* A, const float* x,
    const float beta, float* y) {
  cblas_sgemv(CblasRowMajor, TransA, M, N, alpha, A, N, x, 1, beta, y, 1);
}

C(matrix)←αAB + βC

template<typename T>
void gpu_multmat(T* A, T* B, T* C, int M,int K,int N){
     const T alpha = 1,beta=0;
     caffe_gpu_gemm(CblasNoTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);
}

template<>
void caffe_cpu_gemm<float>(const CBLAS_TRANSPOSE TransA,
    const CBLAS_TRANSPOSE TransB, const int M, const int N, const int K,
    const float alpha, const float* A, const float* B, const float beta,
    float* C) {
  int lda = (TransA == CblasNoTrans) ? K : M;
  int ldb = (TransB == CblasNoTrans) ? N : K;
  cblas_sgemm(CblasRowMajor, TransA, TransB, M, N, K, alpha, A, lda, B,
      ldb, beta, C, N);
}

A=M*N  B=M*K
C=A'*B   N M K

template<typename T>
void cpu_multTmat(T* A, T* B, T* C, int M,int K,int N){
     const T alpha = 1,beta=0;
     caffe_cpu_gemm(CblasTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);
    // cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M, N, K, alpha, A, M, B,    K, beta, C, M);
}

A=M*N B=N*K

C=A*B   M N K



template<typename T>
void cpu_multmat(T* A, T* B, T* C, int M,int K,int N){
     const T alpha = 1,beta=0;
     caffe_cpu_gemm(CblasNoTrans,CblasNoTrans,M,N,K,alpha,A,B,beta,C);
    // cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans, M, N, K, alpha, A, M, B,    K, beta, C, M);
}

計算矩陣乘法的函式之一是 cblas_sgemm，使用單精度實數，另外還有對應雙精度實數，單精度複數和雙精度複數的函式。在此以 cblas_sgemm為例。

函式定義為：

void cblas_sgemm(const enum CBLAS_ORDER Order, const enum CBLAS_TRANSPOSE TransA,

const enum CBLAS_TRANSPOSE TransB, const int M, const int N,

const int K, const float alpha, const float *A,

const int lda, const float *B, const int ldb,

const float beta, float *C, const int ldc)

得到的結果是:

C = alpha*op( A )*op( B ) + beta*C

const enum CBLAS_ORDER Order，這是指的資料的儲存形式，在CBLAS的函式中無論一維還是二維資料都是用一維陣列儲存，這就要涉及是行主序還是列主序，在C語言中陣列是用行主序，fortran中是列主序。我還是習慣於是用行主序，所以這個引數是用CblasRowMajor，如果是列主序的話就是 CblasColMajor。

const int M，矩陣A的行，矩陣C的行

const int N，矩陣B的列，矩陣C的列

const int K，矩陣A的列，矩陣B的行

const float alpha， const float beta，計算公式中的兩個引數值，如果只是計算C=A*B，則alpha=1,beta=0

const float *A， const float *B， const float *C，矩陣ABC的資料

const int lda， const int ldb， const int ldc，在BLAS的文件裡，這三個引數分別為ABC的行數，但是實際使用發現，在CBLAS裡應該是列數。

各種內建函式技巧總結
2024-11-16
函式
LaTeX中各種常用盒子的使用總結
2020-10-28
spark中的聚合函式總結
2018-09-13
Spark函式
JS 中的函式 this 指向總結
2024-04-06
JS函式
excel最常用的八個函式彙總 excel中各函式的用途功能
2022-02-28
Excel函式
C和C++篇——各種各樣的函式
2020-10-20
C++函式
Linux Shell中各種括號用法總結!
2023-04-27
Linux
Maven-POM中的各種scope的行為總結
2018-05-16
Maven
Emgucv使用中常用函式總結
2019-01-04
函式
css各種佈局總結
2019-03-20
CSS
element ui中選擇元件el-select各種樣式和功能總結
2020-10-13
UI元件
python，函式各種基礎知識
2020-09-24
Python函式
建構函式的prototype與各種繼承
2020-11-06
函式繼承
前端各種迴圈用法總結
2020-01-12
前端
Java中各種Log的使用
2019-11-10
Java
(14)caffe總結之Linux下Caffe如何除錯
2020-04-04
Linux除錯
總結常用的字串函式
2019-06-08
字串函式
Sigmoid函式總結
2019-02-22
Sigmoid函式
PHP中很屌但經常被各種忽略的過濾器函式
2018-09-12
PHP過濾器函式
phpRedis函式使用總結【分類詳細】
2018-11-10
PHPRedis函式
python中list方法與函式的學習總結
2021-03-15
Python函式
python中list的各種方法使用
2018-10-03
Python
(2)caffe總結之目錄結構
2020-04-04
mysql日期函式總結
2020-09-25
MySql函式
PHP常用函式總結
2023-02-23
PHP函式
重構 - 用各種方式優化自己的函式庫
2018-06-11
優化函式
前端樹形Tree資料結構使用-🤸🏻‍♂️各種姿勢總結
2024-02-25
前端資料結構
(8)caffe總結之solver及其配置
2020-04-04
(11)caffe總結之命令列解析
2020-04-04
命令列
php 驗證格式的函式總結
2019-02-16
PHP函式
Python函式引數總結
2018-12-07
Python函式
mysql函式全面總結KSVM
2022-03-01
MySql函式
MATLAB生成服從各種分佈的隨機數函式
2019-03-28
Matlab隨機函式
SqlServer 查詢的幾種方式以及數字函式、時間函式的應用總結（迴歸基礎）
2020-08-03
SQLServer函式
一文弄懂分散式場景中各種鎖的原理及使用
2020-12-14
分散式
JS中建立函式的幾種方式
2019-02-16
JS函式
分門別類總結Java中的各種鎖，讓你徹底記住
2019-04-08
Java
C++ sort排序函式的用法總結
2019-03-09
C++排序函式

caffe中各種cblas的函式使用總結

相關文章