3U一體,英偉達DPU使資料中心成為新一代計算單元
兩個月前,在NVIDIA GTC 2021峰會上,NVIDIA正式釋出了新一代資料處理器NVIDIA BlueField-3 DPU,為資料中心提供強大的軟體定義網路、儲存和網路安全加速功能。
兩個月後,筆者有幸採訪到了NVIDIA網路事業部亞太區市場開發高階總監宋慶春和UCloud資深技術專家馬彥青,聽兩位跟我們分享了NVIDIA DOCA是如何實現從BlueField-3晶片級資料中心到三U一體超大規模資料中心的統一架構,以及UCloud基於NVIDIA DOCA生態的技術實踐。
為什麼NVIDIA要推出DPU?
隨著AI技術的普及和資料量爆發性增長,資料中心正在發生變革。從傳統的馮·諾依曼架構的資料中心轉向以資料為中心的架構,資料在網路通訊過程中,很多通訊模型會制約整個系統效能的發展,這就給我們提出了一個新的挑戰--如何繼續提升資料中心效能。
網路計算以資料為中心的新的架構,幫我們解決了這個問題。以資料為中心的新的架構,意味著資料在哪裡,計算就在那裡;當資料在GPU上,計算就在GPU上;當資料在CPU上,計算就在CPU上;當資料在網路中傳輸的時候,計算就在網路中。
透過這樣的方式就可以解決網路傳輸中多打一的瓶頸問題或丟包問題。新的架構可以使通訊延時降低10倍以上。所以,網路計算成為我們現在以資料為中心這種核心計算架構的關鍵技術之一。
NVIDIA網路事業部亞太區市場開發高階總監宋慶春表示:“DPU的出現為以資料為中心的計算架構提供了非常創新的思路。以OVS操作為例,當我們run OVS在CPU上,會消耗很多CPU的核,但執行OVS的效率非常低,如果要把OVS操作放在DPU上可以把這個包轉發率大幅度提升,而把CPU利用率大大地降低。”
BlueField-3構建下一代安全資料中心計算單元
據宋慶春介紹,BlueField-3是業界第一款400G速度的DPU。在BlueField-3上,我們會出400G的Ethernet或者InfiniBand的介面。值得一提的是,在BlueField-3上可以來實現400Gb/s加解密的速度,不管是用IPSec還是用TLS,在加解密的速度上都可以達到400Gb/s的全線速。
不僅如此,BlueField-3還整合16個ARM CPU的核,它有更powerful的處理器。從它整個Offload(解除安裝)功能來看,一個BlueField-3的DPU可以實現的offload功能可以相當於300個X86CPU的核,這樣我們原來需要很多CPU的核來做的操作,透過用DPU專業的offload engine,可以輕鬆地在DPU上面來實現,從而把這麼多的CPU核offload出來,還給業務。
在儲存上可以實現18個million的IOP/s。現在儲存如果能達到1個million的IOP/s已經是非常高的效能,但在BlueField-3上,可以在不消耗主機CPU的情況下而達到18million的IOP/s。
DOCA實現從單晶片到超大規模的資料中心統一架構
據瞭解,DOCA軟體開發包是專門為DPU開發的軟體包。它的價值就像CUDA對GPU一樣,透過CUDA可以看到所有GPU的開發介面,可以對它做程式設計。
DOCA也是如此,DOCA上各種業務,不管儲存還是安全,以及其他與使用者有關的業務都可以透過DOCA介面呼叫DPU裡Offload的Engine,安全、網路、儲存以及Orchestration,來對它進行程式設計。從DOCA的Vision來看,是想提供透過軟體定義把所有的硬體加速的engine都呼叫起來的Infrastructure服務。
不僅如此,我們還可以透過DOCA來實現軟體定義網路,可以透過DOCA來實現軟體定義儲存,透過DOCA來實現軟體定義安全,無論是儲存、安全和網路,你都可以透過DOCA和BlueField硬體關聯起來,直接呼叫到硬體的加速引擎。
從DOCA軟體棧來看,DOCA軟體棧主要有兩層:一是DOCA的driver和runtime,二是DOCA的Library,DOCA library主要是針對業務提供介面,在driver和runtime上,主要是怎麼樣呼叫硬體加速engine,怎麼樣將硬體的加速engine提供給上層的通訊庫。
從DPU生態系統來看,已經得到了不管是作業系統廠商還是做應用的廠商,還是做安全、儲存各個廠商的廣泛支援。
UCloud基於DPU構建下一代軟體定義資料中心基礎架構
近年來,雲主機因其彈性、易用、低成本優勢逐漸成為企業部署業務的首選,但有些對業務效能要求極高的企業依然會選擇使用獨享的物理機。傳統的物理機固然具備天然的高效能和強隔離特性,實際上卻由於部署流程冗長、靈活擴充套件性較差而難以滿足企業高速發展的業務需求。為此,UCloud的裸金屬物理雲2.0就很好的解決了上述問題,其兼具物理機的高效能與虛擬機器的彈性。
據UCloud資深技術專家馬彥青介紹,我們基於DPU&DOCA做的網路解除安裝。
我們原先的網路架構使用的是VPC閘道器,作為裸金屬伺服器的VPC之間劃分的方法,這種方法會使用很多的閘道器伺服器叢集來進行管理,而這個叢集伺服器本身就面臨著一個成本,大概4-8臺一個小叢集,當跨閘道器的時候會存在頻寬的瓶頸。
我們將原來的10G網路卡提升到現在DPU25G之後,它的效能也大大提高,在我們裸金屬2.0產品裡,做了雙網路卡的bonding之後,頻寬可以提高到50G。這樣在裸金屬網路架構裡使用了DPU之後,就可以和快傑雲主機網路使用相同的VPC管理方式,而且雙方之間可以進行直接互通,也提高了它的連線效率。
不僅如此,UCloud還利用DPU和DOCA重構了UCloud裸金屬儲存架構。使用NVIDIA BlueField DPU提供的NVMe SNAP功能,將UCloud的雲端儲存產品RSSD呈現為本地的NVMe系統盤和資料盤,為物理雲客戶提供了更靈活易用的雲盤儲存服務,並且,UCloud的RSSD雲盤使用BlueField DPU成熟的RDMA能力,效能也達到了非常高的水平,真正實現了靈活性與效能的兼顧。
馬彥青表示:“雙方在裸金屬物理雲的基礎上進一步探索虛擬化應用場景,DPI深度包檢測以及Micro Segmentation等應用場景,非常期待雙方的持續合作為市場帶來充滿創新和有價值的雲產品。”
寫在最後,隨著網路計算和DPU的崛起,資料中心成為了新的計算單元。從計算到網路,從GPU到CPU和DPU,英偉達構建的“AI帝國”已經初步完成。誰掌握了計算和資料,誰就掌握了未來。在這條道路上,英偉達已經先走一步。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2777788/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 超算“猛將”英偉達
- Apache Flink 為什麼能夠成為新一代大資料計算引擎?Apache大資料
- AI新利器,英偉達推出新一代超強GPUAIGPU
- 英偉達GPU顯示卡計算能力評估GPU
- 英偉達財報:2023年Q4英偉達銷售額飆升23% 成為全球最大的半導體供應商
- 一文讀懂資料中心計算市場CPU、DPU和GPU的區別GPU
- 擁抱Arm,將Quadro效能翻倍,英偉達剛剛還發布了全新DPU戰略
- 英偉達新一代 RTX A6000 顯示卡即將上市:48GB 視訊記憶體記憶體
- Epic募資10億美元搞元宇宙,英偉達也來攪局元宇宙
- 現代網路成為NVIDIA“3U一體”架構的基石架構
- 英偉達財報:2023財年Q4英偉達營收為60.5億美元 同比下滑21%營收
- 英偉達神秘影片基礎模型「Cosmos」曝光,資料全靠偷模型
- 英偉達淨利潤高達50% ARM成史上最大泡沫背後的半導體公司
- 聚焦 DPU 技術研發與創新 天翼雲打造全新一代雲端計算體系結構
- HPE和英偉達如何為企業AI提供一條龍服務?AI
- 英偉達:資料顯示顯示卡越好吃雞水平越高
- 與英特爾搶市場,英偉達的資料中心業務能增長到多大?
- 英偉達市值超過3.37萬億美元 超越蘋果成為全球市值最高的公司蘋果
- 英偉達財報:2020年英偉 達淨利潤23.74億美元 同比增長282%
- 十年磨一劍:英偉達最「閃」GPU 登場,揭曉新一代晶片架構圖靈GPU晶片架構圖靈
- 英偉達新一代移動顯示卡曝光:擁有 8GB 視訊記憶體,跑分超 RTX 3060記憶體
- 英偉達的AI晶片霸主之路!AI晶片
- 英偉達GPU加速Cloudera資料平臺提升欺詐檢測能力GPUCloud
- 英偉達財報:2025財年Q3英偉達營收351億美元創新高營收
- 英偉達財報:2022年Q1英偉達收入82.9億美元 同比增長46%
- 英偉達財報:2024財年Q4英偉達營收達221億美元 同比增長265%營收
- 極氪成為英偉達「全能晶片」首客 夏皮羅:盡力擺脫禁令約束晶片
- 英偉達gtx1630正式發售:新一代入門級顯示卡要來了嗎
- 英偉達GeForce Now雲遊戲服務上線 月費35元遊戲
- 英偉達控制皮膚沒有顯示設定 英偉達顯示設定不可用
- 雲端計算成為資料倉儲的新重心
- 有英偉達新卡的安裝
- 【投資認知】- 2024Q1的英偉達NVIDIA
- 用“AI核彈”飽和攻擊的英偉達,如何贏下AI計算新賽場?AI
- 英偉達財報:2018年Q1英偉 達淨利潤12.44億美元 同比增長145%
- 英偉達:英偉達2022年Q4營收76.43億美元 淨利潤同比增長106%營收
- 華為AI晶片真能幹掉英偉達,顛覆現有格局?AI晶片
- 英偉達明示RTX3090大量細節,新一代安培架構顯示卡9月登場架構