MKL庫矩陣乘法

GeoFXR發表於2022-04-21

原文網址 : https://www.cnblogs.com/GeophysicsWorker/p/16175589.html

此示例是利用Intel 的MKL庫函式計算矩陣的乘法，目標為：\(C=\alpha*A*B+\beta*C\)，由函式cblas_dgemm實現；

其中\(A\)為\(m\times k\)維矩陣，\(B\)為\(k\times n\)維矩陣，\(C\)為\(m\times n\)維矩陣。

1 cblas_dgemm引數詳解

fun cblas_dgemm(Layout,		//指定行優先(CblasRowMajor,C)或列優先(CblasColMajor,Fortran)資料排序
               TransA,		//指定是否轉置矩陣A
               TransB,		//指定是否轉置矩陣B
               M,		//矩陣A和C的行數
               N,		//矩陣B和C的列數
               K,		//矩陣A的列，B的行
               alpha,		//矩陣A和B乘積的比例因子
               A,		//A矩陣
               lda,		//矩陣A的第一維的大小
               B,		//B矩陣
               ldb,		//矩陣B的第一維的大小
               beta,		//矩陣C的比例因子
               C,		//(input/output) 矩陣C
               ldc		//矩陣C的第一維的大小
               )

cblas_dgemm矩陣乘法預設的演算法就是\(C=\alpha*A*B+\beta*C\)，若只需矩陣\(A\)與\(B\)的乘積，設定\(\alpha=1,\beta=0\)即可。

2 定義待處理矩陣

#include <stdio.h>
#include <stdlib.h>
#include "mkl.h"		// 呼叫mkl標頭檔案

#define min(x,y) (((x) < (y)) ? (x) : (y))

double* A, * B, * C;		//宣告三個矩陣變數，並分配記憶體
int m, n, k, i, j;			//宣告矩陣的維度，其中
double alpha, beta;

m = 2000, k = 200, n = 1000;
alpha = 1.0; beta = 0.0;

A = (double*)mkl_malloc(m * k * sizeof(double), 64);	//按照矩陣維度分配記憶體
B = (double*)mkl_malloc(k * n * sizeof(double), 64);	//mkl_malloc用法與malloc相似，64表示64位
C = (double*)mkl_malloc(m * n * sizeof(double), 64);
if (A == NULL || B == NULL || C == NULL) {		//判空

    mkl_free(A);				
    mkl_free(B);
    mkl_free(C);
    return 1;
}

for (i = 0; i < (m * k); i++) {		//賦值
    A[i] = (double)(i + 1);
}

for (i = 0; i < (k * n); i++) {
    B[i] = (double)(-i - 1);
}

for (i = 0; i < (m * n); i++) {
    C[i] = 0.0;
}

其中\(A\)和\(B\)矩陣設定為：

\[\begin{array}{l} A = \left[ {\begin{array}{*{20}{c}} {1.0}&{2.0}& \cdots &{1000.0}\\ {1001.0}&{1002.0}& \cdots &{2000.0}\\ \vdots & \vdots & \ddots & \cdots \\ {999001.0}&{999002.0}& \cdots &{1000000.0} \end{array}} \right] \space B = \left[ {\begin{array}{*{20}{c}} {-1.0}&{-2.0}& \cdots &{-1000.0}\\ {-1001.0}&{-1002.0}& \cdots &{-2000.0}\\ \vdots & \vdots & \ddots & \cdots \\ {-999001.0}&{-999002.0}& \cdots &{-1000000.0} \end{array}} \right] \end{array} \]

\(C\)矩陣為全0。

3 執行矩陣乘法

回到例子中，對照上面的引數，將C矩陣用A與B的矩陣乘法表示：

cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
            m, n, k, alpha, A, k, B, n, beta, C, n);

//在執行完成後，釋放記憶體
mkl_free(A);
mkl_free(B);
mkl_free(C);

執行後的得到結果如下：

完整程式碼

#include <stdio.h>
#include <stdlib.h>
#include "mkl.h"

#define min(x,y) (((x) < (y)) ? (x) : (y))

int main()
{
    double* A, * B, * C;
    int m, n, k, i, j;
    double alpha, beta;


    m = 2000, k = 200, n = 1000;

    alpha = 1.0; beta = 0.0;

    A = (double*)mkl_malloc(m * k * sizeof(double), 64);
    B = (double*)mkl_malloc(k * n * sizeof(double), 64);
    C = (double*)mkl_malloc(m * n * sizeof(double), 64);
    if (A == NULL || B == NULL || C == NULL) {

        mkl_free(A);
        mkl_free(B);
        mkl_free(C);
        return 1;
    }


    for (i = 0; i < (m * k); i++) {
        A[i] = (double)(i + 1);
    }

    for (i = 0; i < (k * n); i++) {
        B[i] = (double)(-i - 1);
    }

    for (i = 0; i < (m * n); i++) {
        C[i] = 0.0;
    }

    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
        m, n, k, alpha, A, k, B, n, beta, C, n);


    for (i = 0; i < min(m, 6); i++) {
        for (j = 0; j < min(k, 6); j++) {
            printf("%12.0f", A[j + i * k]);
        }
        printf("\n");
    }

    for (i = 0; i < min(k, 6); i++) {
        for (j = 0; j < min(n, 6); j++) {
            printf("%12.0f", B[j + i * n]);
        }
        printf("\n");
    }

    for (i = 0; i < min(m, 6); i++) {
        for (j = 0; j < min(n, 6); j++) {
            printf("%12.5G", C[j + i * n]);
        }
        printf("\n");
    }

    mkl_free(A);
    mkl_free(B);
    mkl_free(C);

    return 0;
}

矩陣乘法
2024-11-07
矩陣
cuda 加速矩陣乘法
2024-03-15
矩陣
【Triton 教程】矩陣乘法
2024-10-31
矩陣
【矩陣乘法】Matrix Power Series
2020-12-19
矩陣
【矩陣乘法】【快速冪】遞推
2020-12-19
矩陣
POJ 3613 Cow Relays 矩陣乘法Floyd+矩陣快速冪
2019-03-05
矩陣
MKL稀疏矩陣運算示例及函式封裝
2023-04-23
矩陣函式封裝
怎樣用python計算矩陣乘法？
2021-09-11
Python矩陣
CUDA 矩陣乘法終極優化指南
2021-09-15
矩陣優化
torch中向量、矩陣乘法大總結
2020-12-10
矩陣
斐波那契數列Ⅳ【矩陣乘法】
2020-12-12
矩陣
04 矩陣乘法與線性變換複合
2018-12-01
矩陣
想學人工智慧，先從理解矩陣乘法開始
2018-10-26
人工智慧矩陣
bzoj2326: [HNOI2011]數學作業（矩陣乘法）
2018-04-07
矩陣
bzoj4547: Hdu5171 小奇的集合（矩陣乘法）
2018-03-14
矩陣
bzoj4887: [Tjoi2017]可樂（矩陣乘法+快速冪）
2018-04-16
矩陣
線性代數 - 矩陣形式下的最小二乘法
2020-10-01
矩陣
MPI矩陣向量乘法程式碼《並行程式設計導論》
2020-12-16
矩陣並行行程程式設計
矩陣的乘法運算與css的3d變換（transform）
2023-10-05
矩陣CSS3DORM
洛谷P3193 [HNOI2008]GT考試(dp 矩陣乘法)
2019-02-13
矩陣
bzoj2875: [Noi2012]隨機數生成器（矩陣乘法）
2018-03-24
隨機矩陣
脈動陣列在二維矩陣乘法及卷積運算中的應用
2018-04-15
陣列矩陣卷積
【矩陣基礎與維度分析】【公式細節推導】矩陣非線性最小二乘法泰勒展開
2022-02-28
矩陣公式
巨大的矩陣（矩陣加速）
2024-08-16
矩陣
鄰接矩陣、度矩陣
2021-12-07
矩陣
奇異矩陣，非奇異矩陣，偽逆矩陣
2020-09-29
矩陣
資料結構：陣列，稀疏矩陣，矩陣的壓縮。應用：矩陣的轉置，矩陣相乘
2020-10-28
資料結構陣列矩陣
矩陣
2024-04-28
矩陣
Python的向量和矩陣乘法意義大全包括dot和*的區別（2020）
2020-10-10
Python矩陣
大模型終端部署新趨勢：硬體直接支援混合矩陣乘法
2024-08-19
大模型矩陣
求任意矩陣的伴隨矩陣
2024-06-18
矩陣
矩陣和陣列
2020-10-06
矩陣陣列
理解矩陣
2018-08-06
矩陣
海浪矩陣
2024-05-05
矩陣
矩陣相乘
2020-11-01
矩陣
稀疏矩陣
2020-10-15
矩陣
螺旋矩陣
2024-09-03
矩陣
8.6 矩陣？
2024-08-06
矩陣

MKL庫矩陣乘法

1 cblas_dgemm引數詳解

2 定義待處理矩陣

3 執行矩陣乘法

完整程式碼

相關文章