第一篇：GPU 程式設計技術的發展歷程及現狀

穆晨發表於2016-12-05

GPU程式設計

前言

本文通過介紹 GPU 程式設計技術的發展歷程，讓大家初步地瞭解 GPU 程式設計，走進 GPU 程式設計的世界。

馮諾依曼計算機架構的瓶頸

曾經，幾乎所有的處理器都是以馮諾依曼計算機架構為基礎的。該系統架構簡單來說就是處理器從儲存器中不斷取指，解碼，執行。

但如今這種系統架構遇到了瓶頸：記憶體的讀寫速度跟不上 CPU 時脈頻率。具有此特徵的系統被稱為記憶體受限型系統，目前的絕大多數計算機系統都屬於此型別。

為了解決此問題，傳統解決方案是使用快取技術。通過給 CPU 設立多級快取，能大大地降低儲存系統的壓力：

然而隨著快取容量的增大，使用更大快取所帶來的收益增速會迅速下降，這也就意味著我們要尋找新的辦法了。

對 GPU 程式設計技術發展具有啟發意義的幾件事

1. 70年代末期，克雷系列超級計算機研製成功 (克雷1當年耗資800萬美元)。

此類計算機採用若干記憶體條的共享記憶體結構，即這些記憶體條可以與多個處理器相連線，從而發展成今天的對稱多處理器系統 (SMD)。

克雷2是向量機 - 一個操作處理多個運算元。

如今的 GPU 裝置的核心也正是向量處理器。

2. 80年代初期，一家公司設計並研製了一種被稱為連線機的計算機系統。

該系統具有16個 CPU 核，採用的是標準的單指令多資料 (SIMD) 並行處理。連線機通過這種設計能夠消除多餘的訪存操作，並將記憶體讀寫週期變為原來的 1/16 。

3. CELL 處理器的發明

這類處理器很有意思，其架構大致如下圖所示：

在此結構中，一個 PPC 處理器作為監管處理器，與大量的 SPE流處理器相連通，組成了一個工作流水線。

對於一個圖形處理過程來說，某個 SPE 可負責提取資料，另一個 SPE 負責變換，再另一個負責存回。這樣可構成一道完完整整的流水線，大大提高了處理速度。

順便提一句，2010年超級計算機排名第三的計算機就是基於這種設計理念實現的，佔地面積達560平方米，耗資 1.25 億美元。

多點計算模型

叢集計算是指通過將多個效能一般的計算機組成一個運算網路，達到高效能運算的目的。這是一種典型的多點計算模型。

而 GPU 的本質，也同樣是多點計算模型。其相對於當今比較火的Hadoop/Spark叢集來說：“點”由單個計算機變成了單個SM (流處理器簇)，通過網路互連變成了通過視訊記憶體互連 (多點計算模型中點之間的通訊永遠是要考慮的重要問題)。

GPU 解決方案

隨著 CPU "功耗牆" 問題的產生，GPU 解決方案開始正式走上舞臺。

GPU 特別適合用於平行計算浮點型別的情況，下圖展示了這種情況下 GPU 和 CPU 計算能力的差別：

但這可不能說明 GPU 比 CPU 更好，CPU應當被淘汰。上圖的測試是在計算可完全並行的情況下進行的。

對於邏輯更靈活複雜的序列程式，GPU 執行起來則遠不如 CPU 高效 (沒有分支預測等高階機制)。

另外，GPU 的應用早已不侷限於影象處理。事實上 CUDA 目前的高階板卡 Tesla 系列就是專門用來進行科學計算的，它們連 VGA 介面都沒。

幾款新的顯示卡及其配置 (僅列 N 卡)

注：

1. 各引數的具體含義將在以後的文章中做細緻分析

2. 當前顯示卡的具體引數資訊可通過除錯工具獲取到 (方法略)

主流 GPU 程式設計介面

1. CUDA

是英偉達公司推出的，專門針對 N 卡進行 GPU 程式設計的介面。文件資料很齊全，幾乎適用於所有 N 卡。

本專欄講述的 GPU 程式設計技術均基於此介面。

2. Open CL

開源的 GPU 程式設計介面，使用範圍最廣，幾乎適用於所有的顯示卡。

但相對 CUDA，其掌握較難一些，建議先學 CUDA，在此基礎上進行 Open CL 的學習則會非常簡單輕鬆。

3. DirectCompute

微軟開發出來的 GPU 程式設計介面。功能很強大，學習起來也最為簡單，但只能用於 Windows 系統，在許多高階伺服器都是 UNIX 系統無法使用。

總結，這幾種介面各有優劣，需要根據實際情況選用。但它們使用起來方法非常相近，掌握了其中一種再學習其他兩種會很容易。

學習 GPU 程式設計的意義

1. 不單能學會如何使用 GPU 解決問題，更讓我們更加深入地瞭解並行程式設計思想，為以後全面地掌握各種並行技術打下鋪墊。

2. 平行計算相關知識的研究與發展勢必會成為未來IT業界與學界的一大熱點。

2019中國智慧語音的發展歷程、現狀及前景分析
2019-11-26
產品生命週期（PLM）發展歷程及技術核心分析指導
2022-11-21
計算機的發展歷程
2024-12-08
計算機
邊緣計算技術國內外發展現狀與發展對策
2019-11-16
閒話接入光（電）纜線路的技術發展歷程
2022-05-23
邊緣計算的發展歷程
2019-01-20
Linux運維技術的現狀如何？Linux如何發展？
2020-09-27
Linux運維
大資料系列 1：大資料技術發展歷程
2018-12-30
大資料
探討AIGC的崛起歷程，淺析其背後技術發展
2023-05-10
AIGC
影片美顏SDK工具中人臉識別技術的發展歷程
2022-12-08
區塊鏈發展歷程，區塊鏈技術的落地應用
2020-11-25
區塊鏈
從Lisp到Vue、React再到 Qwit：響應式程式設計的發展歷程
2023-04-13
LispVueReact程式設計
Java 的發展歷程
2024-12-06
Java
【Go併發程式設計】第一篇 - Goroutines排程
2018-05-29
Go程式設計
【Go併發程式設計】第一篇 – Goroutines排程
2019-03-04
Go程式設計
美顏sdk人臉配準技術發展現狀
2022-12-21
2021車牌識別相機技術發展現狀
2021-07-15
HTTP - 發展歷程
2019-01-09
HTTP
七、資料庫技術的發展及新技術
2018-03-24
資料庫
華為的發展歷程
2020-12-01
GPU程式設計--CPU和GPU的設計區別
2018-05-07
GPU程式設計
程式設計師如何乘風破浪？從資料庫歷史看技術人發展 | 週四直播
2020-11-17
程式設計師資料庫
虛擬化的發展歷程和實現方式
2018-07-11
HTTP版本發展歷程
2018-10-05
HTTP
現代 CPU 技術發展
2023-12-21
SpringBoot 併發程式設計學習歷程(絕對的乾貨)
2018-04-05
Spring Boot程式設計
一個程式設計師的買房歷程
2020-07-31
程式設計師
程式設計師簡歷探秘，java語言發展前景
2021-09-11
程式設計師Java
阿里面試技術手冊（二）：大型網站架構演化發展歷程
2021-09-11
阿里面試網站架構
toB應用私有化交付發展歷程、技術對比和選型
2022-11-21
人工智慧晶片發展的現狀及趨勢
2018-10-31
人工智慧晶片
服裝市場的現狀及發展趨勢
2022-05-27
c++11併發程式設計歷程（15）：併發設計以及併發設計資料結構的思考
2020-11-26
C++程式設計資料結構
互動多媒體技術的發展對展廳設計的幫助
2021-10-18
量化秒合約技術開發丨現貨量化跟單系統程式設計開發及程式碼示例
2023-03-30
程式設計
對程式設計師而言，學歷重要還是技術重要？
2018-09-29
程式設計師
自動駕駛汽車技術發展現狀，未來已來
2019-08-22
自動駕駛
JavaScript非同步呼叫的發展歷程
2018-06-27
JavaScript非同步
深度學習發展歷程
2020-11-24
深度學習