【IT168 資訊】11月21日，NVIDIA(英偉達) GTC China 2018在蘇州舉行。上午，NVIDIA創始人兼CEO黃仁勳宣佈了NVIDIA在中國的一系列最新成果與合作進展。

　　NVIDIA是加速計算的開創者與領導者，多年來利用其專門設計的處理器堆疊為眾多關鍵應用程式、工作負載進行了加速。近期在2018全球超算大會(SC2018)上公佈的全球超算系統TOP 500榜單裡，能效最出色的25臺計算機中，有22臺由NVIDIA提供支援。其中全球排名第一的Summit超算系統使用了27648個NVIDIA V100 GPU，以獲得更高的計算能力。

NVIDIA創始人兼CEO 黃仁勳

　　會上，黃仁勳介紹了其最新的HGX-2伺服器平臺，並宣佈了與中國領先科技公司基於HGX-2的合作動態。

　　NVIDIA HGX-2單節點可提供2千萬億次的計算效能，利用 NVIDIA NVSwitch互聯結構等突破性功能，將16個 NVIDIA Tesla V100 Tensor Core GPU 無縫連線到一起，形成一個巨型 GPU。HGX-2 還具有 0.5 TB 記憶體和 16 TB/s 總記憶體頻寬。藉助多精度計算能力，NVIDIA HGX-2可提供無可比擬的靈活性——融合了高精度FP64和FP32，可實現精確高效能運算;也融合了更快速的低精度 FP16 和 INT8，可實現深度學習和機器學習。

NVIDIA HGX-2

　　黃仁勳宣佈，多家領先的伺服器製造商正在利用HGX-2生產具有更高效能的伺服器裝置。浪潮是中國首家構建HGX-2伺服器的廠商，浪潮AI超級伺服器 AGX-5專為解決當前AI深度學習和高效能運算的效能擴充套件難題而設計。同時，聯想、華為、曙光也正在使用HGX-2製造高效能運算平臺。除此之外，百度和騰訊也將藉助 HGX-2為內部應用及雲客戶提供一系列更強大的AI及雲端計算服務。

　　NVIDIA HGX-2的目標是幫助HPC提升計算能力，加速AI與資料分析;而NVIDIA T4，則是專為大規模計算叢集而生。

　　NVIDIA T4 GPU基於全新NVIDIA Turing架構，採用多精度Turing Tensor Core和全新RT Core，與加速的容器化軟體堆疊相結合，可提供更高的效能。如我們所說，T4旨在滿足大規模計算叢集的需求，它具有小巧的外形，功率為70瓦特，單節點伺服器設計可支援從單個 T4 GPU到20 個。透過T4，客戶可同時獲得高效能與靈活性，最大限度地提高計算叢集的吞吐量、利用率和使用者併發性。

NVIDIA T4 GPU

　　今天，NVIDIA公佈了採用T4 GPU的中國客戶，並表示T4已成為普及迅速最快的伺服器GPU。中國首批開始使用T4擴充套件計算叢集的公司包括百度雲、騰訊雲、京東雲以及科大訊飛。中國領先的伺服器製造商，包括浪潮、聯想、華為、曙光、浪潮商用機器和新華三也將推出一系列基於T4的伺服器。黃仁勳表示，目前有超過50款基於T4的伺服器設計正在進行中。

　　除硬體外，軟體堆疊對於加速計算也非常重要，藉助快速的核函式、快速庫、創新演算法和最佳化的應用程式，可實現10到50倍的加速。黃仁勳在演講中指出：“如今，NVIDIA已有600多種加速應用程式，我們的架構相容策略使這些應用可適用於大型部署。加速堆疊是多層次的，並經過精心最佳化，NVIDIA已將許多受歡迎的加速應用容器化，並儲存在NGC(NVIDIA GPU 雲)登錄檔中。”

　　NVIDIA宣佈，中國領先伺服器製造商華為、浪潮、聯想、曙光，已經推出了的全新NGC-Ready系統，讓客戶可以放心地在基於NVIDIA GPU的系統上部署加速軟體，能夠以一種具有可重複性、容器化的方式，在從開發到生產的整個過程中執行加速應用。

　　“新HPC市場，就是科學計算、資料科學和AI。”黃仁勳表示，“每個HPC應用程式都受到摩爾定律中介的限制，NVIDIA一直在為加速整個新HPC市場鋪平道路並超越摩爾定律。藉助V100、HGX-2、T4以及所有加速堆疊，NVIDIA啟動了加速整個新HPC生態的過程。”

黃仁勳：NVIDIA加速計算為新HPC市場鋪平道路

相關文章