高效能運算GPU解決方案系列教程二–高效能運算叢集效能指標

cuda_study發表於2018-03-06
本節課的內容對於很多不瞭解硬體指標的使用者非常重要,超算使用者是如何來評定自己叢集的各方面能力呢?我們一起走進今天的課堂。

2 高效能運算叢集效能指標
2.1 衡量高效能運算叢集的評價指標
2.1.1.    理論峰值效能
FLOPS是指每秒浮點運算次數,Flops用作計算機計算能力的評價係數。根據硬體配置和引數可以計算出高效能運算叢集的理論效能。

1)CPU理論效能計算方法(以Intel CPU為例)
      單精度:主頻*(向量位寬/32)*2
      雙精度:主頻*(向量位寬/64)*2   2代表乘積指令

      
2)GPU理論效能計算方法(以NVIDIA GPU為例)
      單精度:指令吞吐率*運算單元數量*頻率


2.1.2.    實測峰值效能

通過利用測試程式對系統進行整體計算能力進行評價。
Linapck測試:採用主元高斯消去法求解雙精度稠密線性代數方程組,結果按每秒浮點運算次數(flops)表示。
HPL:針對大規模平行計算系統的測試,其名稱為HighPerformanceLinpack(HPL),是第一個標準的公開版本並行Linpack測試軟體包。
用於TOP500與國內TOP100排名依據。


2.1.3.    評價引數
    1) 系統效率=實測峰值/理論峰值
    2) 加速度 S=序列程式執行時間/並行程式執行時間
    3) Amdahl定律
        S =(WS+WP)/(WS+WP/p) =1/(1/p+f(1-1/p))
    4) Gustafson定律
        S =(WS+pwp)/(WS+WP) =p-f(p-1)=f+p(1-f)

原文釋出時間為:2016-7-11 10:46:05
原文由:十四王爺 釋出,版權歸屬於原作者 
本文來自雲棲社群合作伙伴NVIDIA,瞭解相關資訊可以關注NVIDIA官方網站


相關文章