NVIDIA大招揭曉:AI與HPC統一平臺HGX-2

技術小能手發表於2018-06-01

昨天的NVIDIA(英偉達)GTC(中國臺北)2018大會上,CEO黃仁勳正式釋出了首款同時適用於人工智慧與高效能運算的統一計算平臺——NVIDIA HGX-2。

  說起來,大家應該對NVIDIA在GTC 2018(美國聖荷西)大會上釋出的“全球最大GPU”DGX-2多少還有些印象,據稱,這個系統就是採用HGX-2構建的。而在昨天的大會上,NVIDIA方面也表示,DGX-2系統將在第三季度銷售,售價約為399000美元。

  黃仁勳在大會上表示:“計算領域已不同從前。計算需求猛增,而 CPU 擴充套件的速度卻呈放緩之勢。配備Tensor Core GPU的NVIDIA HGX-2為業界提供了融合HPC和AI的多功能計算平臺,這一強大的計算平臺將助力解決全球面臨的重大挑戰。”

NVIDIA大招揭曉:AI與HPC統一平臺HGX-2

  HGX-2採用了最新的NVSwitch互聯技術,將16個Tesla V100 Tensor Core GPU連線為單一巨型GPU,據介紹,它可提供每秒2千萬億次浮點計算的AI效能。作為參考,它的上代產品——去年於Computex 2017上釋出的HGX-1,只裝載了8個GPU。NVSwitch是NVIDIA在聖荷西GTC 2018大會上釋出的最新GPU互聯結構,在NVLink的基礎上進一步進行了擴充套件創新,它的頻寬比最好的 PCIe 交換機高出5倍,它可使多達16個Tesla V100 GPU同時以2.4 TB /秒的速度進行通訊。

  接力登場的HGX-2平臺具備多精度計算能力,可提供獨特的靈活性。該平臺能夠針對科學計算和模擬進行高精度的FP64和FP32運算,並針對 AI訓練和推理進行 FP16 和 Int8 運算,以“多功能性”滿足先進越來越多融合HPC和AI的應用對計算的需求。

  NVIDIA稱,HGX-2在ResNet-50訓練基準下,創下了每秒15500幅影像的AI訓練速度記錄,可取代高達300臺僅配備CPU伺服器。從這個角度來看,該產品可以說確實貫徹了黃仁勳始終堅持的“省錢”理念。在大會上,黃仁勳也笑稱:“買得越多,省得越多。”

NVIDIA大招揭曉:AI與HPC統一平臺HGX-2

  HGX-2的賣點在於,它既可以用於AI訓練,也可以用於推理,同時還能夠為HPC應用提供計算支援。在NVIDIA的命名體系中,HGX-T用於AI訓練,HGX-I用於推理,而SCX系統則用於HPC。

  NVIDIA將HGX-2描述為“構建模組”,製造商可使用它來構建適用於AI和HPC的系統。事實上,現在已經有多家計算系統製造商宣佈計算推出基於HGX-2計算平臺的系統。包括聯想、雲達科技、超微和緯穎科技四家伺服器製造商,他們宣佈計劃於今年下半年將各自的基於HGX-2系統推向市場。此外,全球四大原始裝置製造商(ODM)富士康、英業達、廣達和緯創也正在設計基於 HGX-2 的系統,有望於下半年在全球幾家最大型的雲資料中心投入使用。

  NVIDIA在面向人工智慧工作負載的GPU市場上是毫無爭議的領導者,但仍不可避免地要面臨日益激烈的競爭。2016年英特爾收購了Nervana 公司,目前在英特爾Nervana 神經網路處理器(NPU)方面也一直在進行大量投入與研發,在人工智慧領域,它將是NVIDIA GPU的一個有力競爭對手。

  與此同時,市場上可提供的FPGA(現場可程式設計門陣列)也越來越強大,這些FPGA可用於AI推理。雖然FPGA在AI訓練方面缺乏與GPU對抗的效能,但它可以被程式設計來處理一個神經網路的每一個層次,在推理方面擁有理想的靈活性。

原文釋出時間為:2018-06-1

本文作者:謝濤

本文來自雲棲社群合作伙伴“IT168”,瞭解相關資訊可以關注“IT168”。


相關文章