超算“猛將”英偉達

阿明觀察發表於2020-11-19

 

在談英偉達的大戰略之前,明確兩個重要事件:

英偉達NVIDIA在2019年3月公開以69億美元現金收購Mellanox,該項交易最終在2020年4月塵埃落定。

英偉達NVIDIA在2020年9月宣佈以400億美元現金加股票的方式,對軟銀旗下晶片設計公司、全球重要晶片架構提供商Arm進行收購。

這兩件事情的成功,為英偉達在晶片領域的發展帶來了更深入、更廣泛的發展前景,以及更為利好的影響。從資本市場的表現就可見一斑,按週一美東時間11月16日16:00收盤時的價格計算,英偉達的總市值為3335.56億美元,幾乎快超過某友商市值的兩倍。友商名字不方便公佈,大家可以猜猜看。

前些天業內朋友感嘆,這一年,過得太快了。其實,我更想感嘆,英偉達的市值飆升得太快了。

但這市值增長的背後,卻暗藏著英偉達的更大圖謀:超算大戰略。

根據最新的TOP500榜單排名顯示,英偉達全面領先,無論是針對超算領域的計算、網路還是HPC。

 

事實上,NVIDIA GPU和網路正在越來越多地用於加速世界上最快的超級計算機。

一是,基於NVIDIA技術構建的超算系統佔比絕對領先,包括8個TOP10超算系統在內,近70%進入TOP500榜單的超算系統都基於NVIDIA技術構建。 

二是,NVIDIA Selene超級計算機(HPC)在全球超級計算機速度排行中位列第五。該超級計算機基於NVIDIA DGX A100 640GB系統和NVIDIA Mellanox InfiniBand網路構建。 

三是,在衡量系統能源效率的Green500榜單中,NVIDIA DGX SuperPOD系統位居榜首,得到業界一致肯定。

從SC20(Supercomputing Conference)超算大會公佈的最新TOP500榜單可以看出,英偉達的超算大戰略勢在必得,將在強化現有技術能力部署的前提下,明確了下一步戰略的“三駕馬車”:GPU更強、HPC更快、網路更優。面向超算領域,英偉達的戰略很明確,一點兒都不用含糊,更強更快更優,也將會是其長期屹立超算領域的制勝法寶。

 

更強:GPU一路高歌猛進

 

在超算行業,強中自有強中手。作為超算領域最佳加持者,英偉達在GPU這條發展路上,可謂一路高歌猛進。

AI算力的強大,再一次彰顯了英偉達整體超算戰略的英明。似乎,這也是英偉達命中註定的好趨勢,誰叫AI行業化,行業AI化的智慧化時代來得如此之快呢。

針對資料中心GPU需求來看,英偉達以A100、A40、V100、T4、RTX 6000、RTX 8000多款業界知名的產品系列既已覆蓋。

然而術業有專攻。針對大流量資料工作負載方面,AI算力的需求特別突出,但是隨著NVIDIA A100 80GB GPU的出現,非常有助於各種訓練、推理和超級計算應用等方面的發展,在速度和效能上得以前所未有的滿足。

作為英偉達創始人、現任CEO黃仁勳親手推出的GPU力作,A100第一代產品是在幾個月前的英偉達GTC 2020大會上首次亮相的。

因為是基於英偉達安培(Ampere)架構的首款圖形處理器,所以備受業界關注。當時A100引入了有著里程碑式意義的Tensor Cores雙精度計算技術。要知道以前在NVIDIA V100 Tensor Core GPU上需要10個小時的雙精度模擬作業,在A100上4小時即可完成。

NVIDIA A100 Tensor Core GPU針對AI、資料分析和高效能運算 (HPC)等應用上,實現了更強的加速,針對極其嚴峻的計算挑戰上有了更大作為。A100高效擴充套件性也很突出,數千個A100 GPU在同一個系統中成功實現整合,也可以利用NVIDIA多例項 GPU (MIG) 技術將每個A100 劃分割為七個獨立的GPU例項,獲得對各種規模工作負載的加速。

 

  • 需要注意的是,這裡針對HPC效能的對比中,僅限於NVIDIA V100 GPU第一代產品。

A100的出現,對資料中心大規模的計算帶來了更強的優化效果,不僅統一了人工智慧訓練和推理,同時將靈活、彈性加速的實現可能性向前又推進一步。

作為A100 GPU系列中的最新力作,A100 80GB GPU在繼承了第一代A100 GPU的優勢基礎上,記憶體比第一代A100 GPU提升一倍,也支援NVIDIA HGX AI超級計算平臺。

大記憶體容量和高頻寬,對於AI與HPC實際應用的好處有目共睹,畢竟在這個領域中一切都要以速度決勝負。全新A100採用HBM2e技術,可將A100 40GB GPU的高頻寬記憶體增加一倍至80GB,提供每秒超過2TB的記憶體頻寬。這使得資料可以快速傳輸到全球最快的資料中心GPU A100上,使研究人員能夠更快地加速其應用,處理最大規模的模型和資料集。

由此,我們可以很容易看到全新一代的增強A100 80GB GPU在HPC領域的表現更為突出,相比最早一代2016年代表之作P100 GPU,A100 80GB GPU實現了HPC應用效能的11倍提升。

 

不僅如此,在深度學習、資料分析、能效方面都獲得了前所未有的優化。

對於如RNN-T等自動語言識別模型的AI推理,單個A100 80GB MIG例項可處理更大規模的批量資料,將生產中的推理吞吐量提高1.25倍。

在TB級零售大資料分析基準上,A100 80GB將其效能提高了2倍,使其成為可對最大規模資料集進行快速分析的理想平臺。隨著資料的動態更新,企業可以實時做出關鍵決策。

對於科學應用,A100 80GB可為天氣預報和量子化學等領域提供巨大的加速。材料模擬軟體Quantum Espresso採用單節點A100 80GB實現了近2倍的吞吐量提升。

 

從這幾個比較典型的需要大量資料儲存空間的應用來看,A100 80GB GPU在應用效能上確實成為新一代GPU的亮點。由此在架構特性上可以總結為幾點:

一是,採用第三代Tensor Core核心。通過全新TF32,將上一代Volta架構的AI吞吐量提高多達20倍。通過FP64,將HPC效能提高多達2.5倍。通過 INT8,將AI推理效能提高多達20倍,並且支援BF16資料格式。

二是,採用更大、更快的HBM2e GPU記憶體。從而使記憶體容量增加一倍,在業內率先實現2TB/s以上的記憶體頻寬。

三是,採用MIG技術,將單個獨立例項的記憶體增加一倍,可最多提供七個MIG,每個例項具備10GB記憶體。

四是,採用結構化稀疏技術,將推理稀疏模型的速度提高兩倍。

五是,第三代NVLink和NVSwitch,相較於上一代互連技術,可使GPU之間的頻寬增加至原來的兩倍,將資料密集型工作負載的GPU資料傳輸速度提高至每秒600 gigabytes。

AI能力的強大,表現在GPU產品的推陳出新,以及GPU為行業應用帶來革命性的改變。這就是英偉達的過人之處,好技術帶來行業改變和產業格局變化。

更智即更強。由此而言,對於超算行業的發展來說,更智慧也就自然表現得更為強大了。

 

更快:HPC沒有最快只有更快

 

超算的核心在於快,競爭的價值在於更快。在超算領域只有在超算系統上實現更快的速度,才能實現超算系統整體能力的更強。

作為強化AI算力的全球領先廠商,英偉達新一代DGX Station A100和DGX A100 640GB移動資料中心引起了我特別的注意,這也是在 SC20超級計算大會上與A100 80GB GPU同期釋出的重量級產品。

 

DGX Station A100的AI效能可以達到2.5 petaflops,通過NVIDIA NVLink完全互連,實現四個全新NVIDIA A100 80GB GPU融合在一起的工作組伺服器,同時GPU記憶體高達320GB。更為特別是DGX Station A100也是唯一支援NVIDIA多例項GPU技術(MIG)的工作組伺服器。藉助MIG,單一DGX Station A100最多可提供28個獨立GPU例項以執行並行任務,並可在不影響系統效能的前提下支援多使用者應用。

這也是全球唯一的千萬億級工作組伺服器,如此效能超快的DGX Station A100,被業內稱之為一體式AI資料中心,也就是說,使用者藉助一臺DGX Station A100,就可以在任何地方部署AI超算中心了。

如此說來,作為伺服器級的系統,DGX Station A100無需配備資料中心級電源或散熱系統,卻具有與NVIDIA DGX A100資料中心繫統相同的遠端管理功能。當資料科學家和研究人員在家中或實驗室辦公時,系統管理員可輕鬆地通過遠端連線,執行任何管理任務。

作為一臺隨處可得的AI超級計算機,效能上的突出表現尤為吸引人。為支援諸如BERT Large推理等複雜的對話式AI模型,DGX Station A100比上一代DGX Station提速4倍以上。對於BERT Large AI訓練,其效能提高近3倍。

 

此外,全新DGX A100 640GB系統也將整合到企業版NVIDIA DGX SuperPOD解決方案,使機構能基於以20 個DGX A100系統為單位的一站式AI超級計算機,實現大規模AI模型的構建、訓練和部署。

 

配備A100 80GB GPU的NVIDIA DGX SuperPOD系統將率先安裝於英國的Cambridge-1超級計算機,以加速推進醫療健康領域研究,以及佛羅里達大學的全新HiPerGator AI超級計算機,該超級計算機將賦力這一“陽光之州”開展AI賦能的科學發現。

由此可見,新一代DGX Station A100和DGX A100 640GB移動資料中心的出現,將給AI超級計算機的行業格局帶來一次新的震動。全球雲觀察分析,這有望將超算從傳統超算時代推向真正的智慧超算時代,那麼英偉達必定就是其中舉足輕重的使能者之一。同時AI超算上的創新也將因為NVIDIA A100 80GB GPU而再次迎來新的發展,對AI超算的行業應用普及帶來了更大的發展潛力與空間。

 

更優:高效網路效能空前

 

任何超算系統,離開了高效的網路,基本上談不上超算。可見網路對於超算系統整體價值的貢獻缺一不可。

為此,英偉達併購Mellanox後,對於InfiniBand高效網路的效能發揮得到了空前的提升。

400G InfiniBand系統在之前聽說過業內傳聞,沒有想到英偉達如今很快變成了現實。“NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智慧加速引擎使HPC、AI和超大規模雲基礎設施能夠以更低的成本和複雜性,實現了全球最具挑戰性的網路互連效能。”

為了支撐更強更快的AI超算的需要,Mellanox 400G InfiniBand帶來的加速能力也是值得一看。Mellanox NDR 400G InfiniBand交換機,可提供3倍的埠密度和32倍的AI加速能力。並且將框式交換機系統的聚合雙向吞吐量提高了5倍,達到1.64 petabits/s,減少交換機使用量獲得更大工作負載的支撐,必然對使用者整體應用成本帶來更良好的回報。

 

當然,好的產品,特別是在行業領域有著技術創新領先性的產品,往往贏得市場的認同更為廣泛。

從一組財報資料來看,英偉達截至2020年7月26日的第二季度財報,營收為38.7億美元,創歷史新高,較去年同期的25.8億美元增長50%,較上一季度的30.8億美元增長26%。

其中有一個關鍵資訊就是該季度資料中心方面業務收入出奇高增長,財報期內為17.5億美元,為2019年同期收入6.55億美元的兩倍多。這也是資料中心領域帶來的收入首次出現超越英偉達成立以來的主營視訊遊戲領域業務,財報期內視訊遊戲業務為16.5億美元。

就此來說,英偉達在資料中心取得高速增長成績,與收購Mellanox有著密切相關。

可見,英偉達Mellanox在高效網路方面的效能表現,已經贏得了使用者的心聲,特別是在超算領域,英偉達Mellanox的InfiniBand技術一直備受矚目。

小結:AI超算的未來已來

英偉達的超算大戰略,必然就是將AI加入到HPC中,並擴充套件至傳統超級計算中心之外的平臺,從而引發了全球AI超算大趨勢。

 

與此同時,創新效率超高的英偉達,在加速計算領域、HPC、網路三大領域分別釋出了新一代A100 80GB GPU處理器、新一代DGX StationA100和DGX A100 640GB移動資料中心、Mellanox 400G InfiniBand系統多款重磅新品,可謂三駕馬車並駕齊驅,以應對全球爆發式增長的資料處理需求和日益凸顯的機器學習需要。這對全球超算整體格局的變化,帶來非常積極的推動作用。

更強的GPU,更快的AI超算,更優的高效網路,也將成為英偉達持續向前發展的重要三部曲。

(by Aming) 

- END-

 ?

歡迎文末評論補充!

文章來源:Aming,全球雲觀察,著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。本文和作者回復僅代表個人觀點,不構成任何投資建議。

都看到這裡了,加個關注吧!

【阿明】:科技評論專欄作者、科技媒體從業22年、新聞評論年產出上百萬字,用資料說話,帶你看懂科技上市公司

相關文章