黃仁勳:NVIDIA加速計算為新HPC市場鋪平道路

伺服器頻道發表於2018-11-21

   【IT168 資訊】11月21日,NVIDIA(英偉達) GTC China 2018在蘇州舉行。上午,NVIDIA創始人兼CEO黃仁勳宣佈了NVIDIA在中國的一系列最新成果與合作進展。

  NVIDIA是加速計算的開創者與領導者,多年來利用其專門設計的處理器堆疊為眾多關鍵應用程式、工作負載進行了加速。近期在2018全球超算大會(SC2018)上公佈的全球超算系統TOP 500榜單裡,能效最出色的25臺計算機中,有22臺由NVIDIA提供支援。其中全球排名第一的Summit超算系統使用了27648個NVIDIA V100 GPU,以獲得更高的計算能力。

NVIDIA創始人兼CEO 黃仁勳

  會上,黃仁勳介紹了其最新的HGX-2伺服器平臺,並宣佈了與中國領先科技公司基於HGX-2的合作動態。

  NVIDIA HGX-2單節點可提供2千萬億次的計算效能,利用 NVIDIA NVSwitch互聯結構等突破性功能,將16個 NVIDIA Tesla V100 Tensor Core GPU 無縫連線到一起,形成一個巨型 GPU。HGX-2 還具有 0.5 TB 記憶體和 16 TB/s 總記憶體頻寬。藉助多精度計算能力,NVIDIA HGX-2可提供無可比擬的靈活性——融合了高精度FP64和FP32,可實現精確高效能運算;也融合了更快速的低精度 FP16 和 INT8,可實現深度學習和機器學習。

NVIDIA HGX-2

  黃仁勳宣佈,多家領先的伺服器製造商正在利用HGX-2生產具有更高效能的伺服器裝置。浪潮是中國首家構建HGX-2伺服器的廠商,浪潮AI超級伺服器 AGX-5專為解決當前AI深度學習和高效能運算的效能擴充套件難題而設計。同時,聯想、華為、曙光也正在使用HGX-2製造高效能運算平臺。除此之外,百度和騰訊也將藉助 HGX-2為內部應用及雲客戶提供一系列更強大的AI及雲端計算服務。

  NVIDIA HGX-2的目標是幫助HPC提升計算能力,加速AI與資料分析;而NVIDIA T4,則是專為大規模計算叢集而生。

  NVIDIA T4 GPU基於全新NVIDIA Turing架構,採用多精度Turing Tensor Core和全新RT Core,與加速的容器化軟體堆疊相結合,可提供更高的效能。如我們所說,T4旨在滿足大規模計算叢集的需求,它具有小巧的外形,功率為70瓦特,單節點伺服器設計可支援從單個 T4 GPU到20 個。透過T4,客戶可同時獲得高效能與靈活性,最大限度地提高計算叢集的吞吐量、利用率和使用者併發性。

NVIDIA T4 GPU

  今天,NVIDIA公佈了採用T4 GPU的中國客戶,並表示T4已成為普及迅速最快的伺服器GPU。中國首批開始使用T4擴充套件計算叢集的公司包括百度雲、騰訊雲、京東雲以及科大訊飛。中國領先的伺服器製造商,包括浪潮、聯想、華為、曙光、浪潮商用機器和新華三也將推出一系列基於T4的伺服器。黃仁勳表示,目前有超過50款基於T4的伺服器設計正在進行中。

  除硬體外,軟體堆疊對於加速計算也非常重要,藉助快速的核函式、快速庫、創新演算法和最佳化的應用程式,可實現10到50倍的加速。黃仁勳在演講中指出:“如今,NVIDIA已有600多種加速應用程式,我們的架構相容策略使這些應用可適用於大型部署。加速堆疊是多層次的,並經過精心最佳化,NVIDIA已將許多受歡迎的加速應用容器化,並儲存在NGC(NVIDIA GPU 雲)登錄檔中。”

  NVIDIA宣佈,中國領先伺服器製造商華為、浪潮、聯想、曙光,已經推出了的全新NGC-Ready系統,讓客戶可以放心地在基於NVIDIA GPU的系統上部署加速軟體,能夠以一種具有可重複性、容器化的方式,在從開發到生產的整個過程中執行加速應用。

  “新HPC市場,就是科學計算、資料科學和AI。”黃仁勳表示,“每個HPC應用程式都受到摩爾定律中介的限制,NVIDIA一直在為加速整個新HPC市場鋪平道路並超越摩爾定律。藉助V100、HGX-2、T4以及所有加速堆疊,NVIDIA啟動了加速整個新HPC生態的過程。”


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31545803/viewspace-2220986/,如需轉載,請註明出處,否則將追究法律責任。

相關文章