異構計算,GPU、FPGA、ASIC晶片將三分天下
在IT界,異構計算並不是一個新興的詞。
近十年來,計算行業經歷了從32bit、“x86-64”、多核心、通用GPGPU以及2010年“CPU—GPU”異構計算的變遷。而最近幾年,隨著人工智慧、高效能資料分析和金融分析等計算密集型領域的興起,異構計算才突然火了起來。
因為傳統通用計算的方式已經無法滿足我們對計算能力的需求,異構計算被認為是現階段挑起計算大梁的關鍵技術,阿里雲異構計算產品解決方案就在這樣的大環境下誕生了,這支團隊的掌舵人正是張獻濤。
張獻濤,花名旭卿,武漢大學資訊保安博士,加入阿里巴巴前,他就職於英特爾亞太研發中心,是Xen、KVM等多個開源虛擬化專案的主要貢獻者,曾擔任Xen/IOMMU以及KVM/IA64專案的Maintainer;同時,他也是Intel HAXM加速器的主要作者和貢獻者,並因此獲得英特爾最高成就獎。
2014年,張獻濤正式加入阿里巴巴任資深專家,目前在阿里主要負責虛擬化技術、高效能運算產品、異構計算產品、以及一些創新型別產品的技術和研發的團隊。
在這次訪談中,張獻濤分享了目前企業使用異構計算方案的痛點,他還深入介紹了阿里雲在均衡異構計算資源所做的工作。
異構計算的機遇與挑戰
異構計算是指不同型別的指令集和體系架構的計算單元組成的系統的計算方式,目前 “CPU+GPU”以及“CPU+FPGA” 都是最受業界關注的異構計算平臺。它最大的優點是具有比傳統CPU平行計算更高效率和低延遲的計算效能,尤其是業界對計算效能需求水漲船高的情況下,異構計算變得愈發重要。整個計算行業生態無一不在此發力,晶片企業投入了大量的資金,異構程式設計的開發標準也在逐漸成熟,而主流的雲服務商更是在積極佈局,一時間,異構計算大有取代傳統同構計算之勢。
張獻濤也表示,異構計算能夠很好的滿足人工智慧、高效能資料分析、金融分析等計算密集型領域的計算需求,而這一技術會逐漸取代原來通用計算不擅長的部分。
但是在光鮮亮麗的外殼之下,對於一般使用者來說,異構計算的採購、部署以及使用門檻對絕大多數企業來說都很高。對此,張獻濤主要談到以下幾個痛點:
1.採購成本高:使用者小量採購基本上沒有議價能力,特別是購買FPGA板卡,量少的話採購價格特別高。
2.交付週期長:通常使用者從開始需要採購,到機型選擇、硬體架構設計、供應商選擇、機房選擇、財務審批等流程通常需要幾個月的時間。
3.沒有彈性:採購完了GPU/FPGA的數量就固定了,任務少的話多買的GPU/FPGA就浪費了,任務多的話GPU/FPGA數量又不夠用。
4.沒有硬體紅利:採購完了型號就固定了,如果有新的GPU/FPGA架構上線只能追加預算購買,老的GPU/FPGA效能跟不上應用了。
5.資料孤島:線下的GPU/FPGA和線上的服務無法打通。
另外,他還補充道,做FPGA產品的最大挑戰是整個FPGA的生態環境很差,具備FPGA開發能力特別是開發FPGA做計算加速的客戶非常少。為此,我們會在雲上建立IP開發市場並且引入一系列的FPGA IP合作伙伴,並推動建立雲上FPGA的開發標準,豐富整個FPGA的開發生態環境,吸引更多的IP開發廠商和合作夥伴把他們的IP放在IP開發市場上,去服務他們的終端使用者,從而進一步豐富整個FPGA的生態環境。”
阿里雲在短時間裡先後推出彈性GPU和FPGA異構計算的解決方案,目的就是降低異構計算資源使用的門檻,對高效能運算有需求的企業可以隨買隨用。
阿里雲彈性GPU產品主要面向人工智慧、資料分析、科學計算、電影渲染、影片影像處理、影片轉碼等場景,目前的應用案例包括行為資料分析、千人千面、人臉識別、影片識別、影像識別、物件分類等;阿里雲彈性FPGA產品主要面向人工智慧、半導體設計、基因計算、影片影像處理、資料分析決策等場景,目前的應用案例包括深度學習推理、深度學習模型裁剪、非規整資料計算、影片影像處理、硬體半導體設計等。
阿里雲在異構計算領域的探索
眾所周知,相比CPU,GPU和FPGA擁有太多的優勢,GPU有更高的並行度、更高的單機計算峰值、更高的計算效率;而FPGA的優勢則主要體現在它擁有更高的每瓦效能、非規整資料計算更高的效能、更高的硬體加速效能、更低的裝置互聯延遲。
但在雲端的解決方案上,便意味著優勢的進一步放大,張獻濤介紹,阿里雲GPU和FPGA異構計算解決方案主要有以下特點:
1.GPU/FPGA資源即買即用,彈性伸縮。
2.超大規模資源池,滿足業務峰值的GPU/FPGA數量的需求。
3.享受異構計算超摩爾定律的硬體紅利,以相同的價格使用效能更強的GPU/FPGA例項。
4.最全面的異構產品線,滿足人工智慧訓練、推理,影像影片處理等各種不同的需求。
5.產品整合:和整個阿里雲產品體系深度整合,資料打通。
這些特性完美的解決了使用者使用異構計算方案的痛點。張獻濤還透露,現在大部分客戶都在單機上訓練模型,通常需要幾周到一個月的時間,因此阿里雲正在計劃推出一款超高效能異構叢集的產品。
“該產品的GPU/FPGA之間可以透過25/100Gb ROCE走RDMA協議直連,可以多機多卡,用非常多的GPU/FPGA裝置叢集來共同訓練一個模型,大大減少使用者訓練的時間,從幾周到一個月縮短到一天或者幾個小時的級別。”
值得一提的是,阿里雲異構計算解決方案也針對開發者做出了更友好的體驗:
在GPU程式設計方面,阿里雲會推出分散式多機多卡訓練框架和其他GPU上的效能最佳化服務,能夠大大降低客戶使用多機多卡的門檻,從而減少客戶在雲上做深度學習訓練的時間。
FPGA方面,阿里雲會建立IP開發市場並且引入一系列的FPGA IP合作伙伴,並且會推出自研的IP系列,透過IP市場的繁榮讓更多的終端使用者能夠享受到FPGA的效能加速。
另外,阿里雲還推出了IaaS+的服務,包括髮布E-HPC產品做異構叢集的資源排程、賬號管理和彈性伸縮,透過容器服務來做一鍵部署、分散式訓練和彈性伸縮,透過XDL來做行為資料分析,利用阿里雲自研的GPU彙編器來最佳化提升應用的效能,提高異構計算裝置的利用率,減少資源的採購成本。
未來:GPU、FPGA、ASIC三分天下
人工智慧以及其它新興應用領域對於計算量的需求超過了通用CPU的摩爾定律的發展速度,而異構計算的效能增長速度能夠滿足這些新興的方向和趨勢,可以預見的是,異構計算會在今後的資料中心中佔據越來越多的份額。
宏觀來看,異構計算的發展也得益於國家戰略的推動。例如,最近國家下發了人工智慧的發展規劃,人工智慧已經成為國家戰略,這勢必會刺激異構計算的需求。當然,張獻濤也坦言,雖然異構計算的應用需求越來越多,但通用計算的需求也會一直存在,二者將會長期共存。
毫無疑問,目前異構計算領域GPU處理器已經佔據了主流地位,但對未來的趨勢,張獻濤則表示,“隨著FPGA的生態環境的建立和完善、ASIC晶片的逐漸成熟,未來異構計算領域會呈現GPU、FPGA、ASIC晶片三分天下的局面,GPU、FPGA、ASIC晶片都會有自己獨特的特長和應用領域,有自己獨特的客戶群體。”
這也是張獻濤團隊專注的方向,接下來團隊會發布包括8卡/16卡GPU產品、下一代的Volta架構的GPU產品、新一代的FGPA的產品,而ASIC晶片的產品上雲也正在研發當中。
目前他所帶領的團隊主要有兩個目標:一方面致力於讓異構計算變成使用者即買即用的計算資源,提供最為全面的異構計算產品方案;另一方面致力於讓使用者能夠用好異構資源,充分發揮異構資源的處理能力,讓使用者的服務更具備競爭力。也就是推動異構計算變成一種普適的計算能力。
雲棲大會亮點揭秘
本次杭州雲棲大會將設立異構計算/高效能運算專場、虛擬化技術專場,屆時張獻濤都將發表主題演講,在大會正式開幕之前,他也向雲棲社群透露了一個重磅訊息——阿里雲將釋出幾款重量級的異構計算家族產品,涉及到異構計算、通用計算、高效能運算等多個領域。他表示,這些產品都是為了解決使用者在使用阿里雲的過程中遇到的痛點,包括叢集的管理和排程問題、雲上彈性使用付費軟體的License問題、例項需要即擁有虛擬機器的彈性又要擁有物理機的效能、多機多卡分散式訓練降低訓練時間等問題。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2638327/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- FPGA:AI ASIC的必經之路?FPGAAI
- 【ASIC設計】FPGA小知識拾遺(不斷更新...)FPGA
- FPGA vs. ASIC,誰將引領移動端人工智慧硬體的潮流?FPGA人工智慧
- QT硬體異構計算QT
- 學點不一樣的技術:FPGA可重構技術——FPGA晶片FPGA晶片
- GPU:平行計算利器GPU
- 異構計算的“備胎上位記”
- Yann Lecun官宣Facebook進軍晶片領域野心,自家“ASIC”晶片開發中Yann LeCun晶片
- 阿里雲異構計算髮布:輕量級GPU雲伺服器例項VGN5i阿里GPU伺服器
- NVDIA CUDA ---------GPU計算的革命GPU
- HPC高效能運算知識: 異構平行計算
- 人工智慧推動,ASIC晶片市場佔比大幅提升人工智慧晶片
- 加密數字貨幣需求強勁ASIC晶片訂單火爆加密晶片
- cuda程式設計與gpu平行計算(六):圖稀疏矩陣轉為CSR結構並傳入gpu程式設計GPU矩陣
- 英偉達GPU顯示卡計算能力評估GPU
- GPU加速DiffuseCubeMap經典計算(轉)GPU
- 第三篇:GPU 並行程式設計的運算架構GPU並行行程程式設計架構
- 天下三分分久必合 未來資料庫或將只有一個資料庫
- 賽普拉斯的65nm SRAM與ASIC/FPGA/控制器的介面FPGA
- 前端高效能運算之四:GPU加速計算前端GPU
- 計算新趨勢 瞭解GPU計算和Tesla工作站GPU
- 異構計算助力客戶春節webp圖片編碼Web
- 三星為新的Halong比特幣礦機制造ASIC晶片比特幣晶片
- 深度學習的異構硬體加速:TPU 特性與資料中心的 ASIC 應用(概述篇)深度學習
- PostgreSQLGPU加速(HeteroDBpg_strom)(GPU計算,GPU-DIO-NvmeSSD,列存,GPU記憶體快取)SQLGPU記憶體快取
- 論文榮登計算機體系結構頂會ISCA,晶片架構成為邊緣AI最佳平行計算選擇計算機晶片架構AI
- 未來AI是一種可程式設計FPGA晶片,遠遠超出人類AI程式設計FPGA晶片
- 高度整合的可程式設計邏輯器件fpga晶片處理能力與作用程式設計FPGA晶片
- cuda程式設計與gpu平行計算(四):cuda程式設計模型程式設計GPU模型
- 混合異構資料來源關聯計算最佳化方案
- 第二篇:從 GPU 的角度理解平行計算GPU
- [重磅] HPC應用對GPU計算支援現狀解析GPU
- 三分天下的遊戲圈 PC小遊戲該如何破局?遊戲
- 計算機系統2->從晶片說起 | 晶片怎樣誕生計算機晶片
- 新火種AI|2024,得AI晶片者得天下。AI晶片
- AMD最強RDNA 3架構GPU釋出,小晶片設計、支援DP2.1介面,899美元起架構GPU晶片
- 三分鐘瞭解——計算機網路參考模型計算機網路模型
- python系列--計算異或和Python