3U一體,英偉達DPU使資料中心成為新一代計算單元
兩個月前,在NVIDIA GTC 2021峰會上,NVIDIA正式釋出了新一代資料處理器NVIDIA BlueField-3 DPU,為資料中心提供強大的軟體定義網路、儲存和網路安全加速功能。
兩個月後,筆者有幸採訪到了NVIDIA網路事業部亞太區市場開發高階總監宋慶春和UCloud資深技術專家馬彥青,聽兩位跟我們分享了NVIDIA DOCA是如何實現從BlueField-3晶片級資料中心到三U一體超大規模資料中心的統一架構,以及UCloud基於NVIDIA DOCA生態的技術實踐。
為什麼NVIDIA要推出DPU?
隨著AI技術的普及和資料量爆發性增長,資料中心正在發生變革。從傳統的馮·諾依曼架構的資料中心轉向以資料為中心的架構,資料在網路通訊過程中,很多通訊模型會制約整個系統效能的發展,這就給我們提出了一個新的挑戰--如何繼續提升資料中心效能。
網路計算以資料為中心的新的架構,幫我們解決了這個問題。以資料為中心的新的架構,意味著資料在哪裡,計算就在那裡;當資料在GPU上,計算就在GPU上;當資料在CPU上,計算就在CPU上;當資料在網路中傳輸的時候,計算就在網路中。
透過這樣的方式就可以解決網路傳輸中多打一的瓶頸問題或丟包問題。新的架構可以使通訊延時降低10倍以上。所以,網路計算成為我們現在以資料為中心這種核心計算架構的關鍵技術之一。
NVIDIA網路事業部亞太區市場開發高階總監宋慶春表示:“DPU的出現為以資料為中心的計算架構提供了非常創新的思路。以OVS操作為例,當我們run OVS在CPU上,會消耗很多CPU的核,但執行OVS的效率非常低,如果要把OVS操作放在DPU上可以把這個包轉發率大幅度提升,而把CPU利用率大大地降低。”
BlueField-3構建下一代安全資料中心計算單元
據宋慶春介紹,BlueField-3是業界第一款400G速度的DPU。在BlueField-3上,我們會出400G的Ethernet或者InfiniBand的介面。值得一提的是,在BlueField-3上可以來實現400Gb/s加解密的速度,不管是用IPSec還是用TLS,在加解密的速度上都可以達到400Gb/s的全線速。
不僅如此,BlueField-3還整合16個ARM CPU的核,它有更powerful的處理器。從它整個Offload(解除安裝)功能來看,一個BlueField-3的DPU可以實現的offload功能可以相當於300個X86CPU的核,這樣我們原來需要很多CPU的核來做的操作,透過用DPU專業的offload engine,可以輕鬆地在DPU上面來實現,從而把這麼多的CPU核offload出來,還給業務。
在儲存上可以實現18個million的IOP/s。現在儲存如果能達到1個million的IOP/s已經是非常高的效能,但在BlueField-3上,可以在不消耗主機CPU的情況下而達到18million的IOP/s。
DOCA實現從單晶片到超大規模的資料中心統一架構
據瞭解,DOCA軟體開發包是專門為DPU開發的軟體包。它的價值就像CUDA對GPU一樣,透過CUDA可以看到所有GPU的開發介面,可以對它做程式設計。
DOCA也是如此,DOCA上各種業務,不管儲存還是安全,以及其他與使用者有關的業務都可以透過DOCA介面呼叫DPU裡Offload的Engine,安全、網路、儲存以及Orchestration,來對它進行程式設計。從DOCA的Vision來看,是想提供透過軟體定義把所有的硬體加速的engine都呼叫起來的Infrastructure服務。
不僅如此,我們還可以透過DOCA來實現軟體定義網路,可以透過DOCA來實現軟體定義儲存,透過DOCA來實現軟體定義安全,無論是儲存、安全和網路,你都可以透過DOCA和BlueField硬體關聯起來,直接呼叫到硬體的加速引擎。
從DOCA軟體棧來看,DOCA軟體棧主要有兩層:一是DOCA的driver和runtime,二是DOCA的Library,DOCA library主要是針對業務提供介面,在driver和runtime上,主要是怎麼樣呼叫硬體加速engine,怎麼樣將硬體的加速engine提供給上層的通訊庫。
從DPU生態系統來看,已經得到了不管是作業系統廠商還是做應用的廠商,還是做安全、儲存各個廠商的廣泛支援。
UCloud基於DPU構建下一代軟體定義資料中心基礎架構
近年來,雲主機因其彈性、易用、低成本優勢逐漸成為企業部署業務的首選,但有些對業務效能要求極高的企業依然會選擇使用獨享的物理機。傳統的物理機固然具備天然的高效能和強隔離特性,實際上卻由於部署流程冗長、靈活擴充套件性較差而難以滿足企業高速發展的業務需求。為此,UCloud的裸金屬物理雲2.0就很好的解決了上述問題,其兼具物理機的高效能與虛擬機器的彈性。
據UCloud資深技術專家馬彥青介紹,我們基於DPU&DOCA做的網路解除安裝。
我們原先的網路架構使用的是VPC閘道器,作為裸金屬伺服器的VPC之間劃分的方法,這種方法會使用很多的閘道器伺服器叢集來進行管理,而這個叢集伺服器本身就面臨著一個成本,大概4-8臺一個小叢集,當跨閘道器的時候會存在頻寬的瓶頸。
我們將原來的10G網路卡提升到現在DPU25G之後,它的效能也大大提高,在我們裸金屬2.0產品裡,做了雙網路卡的bonding之後,頻寬可以提高到50G。這樣在裸金屬網路架構裡使用了DPU之後,就可以和快傑雲主機網路使用相同的VPC管理方式,而且雙方之間可以進行直接互通,也提高了它的連線效率。
不僅如此,UCloud還利用DPU和DOCA重構了UCloud裸金屬儲存架構。使用NVIDIA BlueField DPU提供的NVMe SNAP功能,將UCloud的雲端儲存產品RSSD呈現為本地的NVMe系統盤和資料盤,為物理雲客戶提供了更靈活易用的雲盤儲存服務,並且,UCloud的RSSD雲盤使用BlueField DPU成熟的RDMA能力,效能也達到了非常高的水平,真正實現了靈活性與效能的兼顧。
馬彥青表示:“雙方在裸金屬物理雲的基礎上進一步探索虛擬化應用場景,DPI深度包檢測以及Micro Segmentation等應用場景,非常期待雙方的持續合作為市場帶來充滿創新和有價值的雲產品。”
寫在最後,隨著網路計算和DPU的崛起,資料中心成為了新的計算單元。從計算到網路,從GPU到CPU和DPU,英偉達構建的“AI帝國”已經初步完成。誰掌握了計算和資料,誰就掌握了未來。在這條道路上,英偉達已經先走一步。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2777788/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Apache Flink 為什麼能夠成為新一代大資料計算引擎?Apache大資料
- 一文讀懂資料中心計算市場CPU、DPU和GPU的區別GPU
- 聚焦 DPU 技術研發與創新 天翼雲打造全新一代雲端計算體系結構
- 現代網路成為NVIDIA“3U一體”架構的基石架構
- 雲端計算成為資料倉儲的新重心
- 邊緣計算|Hadoop——邊緣計算,有沒有對應的軟體?例如資料中心或雲端計算環境進行資料處理和儲存的Hadoop單一軟體框架?Hadoop框架
- 【08】把 Elasticsearch 當資料庫使:計算後再聚合Elasticsearch資料庫
- 大資料計算生態之資料計算(一)大資料
- DPU晶片頭部企業雲豹智慧加入龍蜥社群,共同推動新一代資料中心基礎設施蓬勃發展晶片
- 美創科技正式成為“資料安全強基計劃”成員單位
- 一文看懂資料分析必備計算功能—記憶體計算記憶體
- Daph:新一代流批一體資料整合與資料處理工具
- 計算機組成與體系結構-資料的表示-碼制計算機
- 計算機組成與體系結構-I/O資料傳輸計算機
- 計算中介軟體 Apache Linkis 成為 Apache 重要專案Apache
- 新一代開源配置中心-Apollo
- Kubernetes 如何成為計算資源的標準
- 英偉達GPU顯示卡計算能力評估GPU
- AI新利器,英偉達推出新一代超強GPUAIGPU
- 超雲將成為資料中心演化的下一個階段
- 為什麼超融合正在成為資料中心的主流?
- 新一代智慧節能資料中心實踐——液冷篇
- 過度強調統計資料會使六西格瑪變成“啞巴”?
- 雲端計算成為未來趨勢
- 本土自研再上新!安謀科技釋出首款“玲瓏”DPU和新一代VPU
- 保障儲存資料多活,杉巖MOS構建新一代多活資料中心
- Java新一代單元測試框架JUnit5速覽Java框架
- 計算機硬體的五大單元 & CPU的種類 & 計算機的執行流程計算機
- wps/excel計算單元格內的算式Excel
- 【計算力學】CST單元格式推導
- 單元測試的覆蓋率計算
- 2020年中國資料產業將佔全球20% 成為資料中心產業
- KISS:使重要軟體簡單
- 英偉達新一代 RTX A6000 顯示卡即將上市:48GB 視訊記憶體記憶體
- 新一代智慧節能資料中心實踐(三)— 液冷篇
- 雲端計算教程學習入門影片課件:雲端計算中心怎麼儲存資料?
- 香港資料中心憑藉哪些優勢,成為亞太地區資料中心樞紐?
- 哪些日常的習慣會使你成為一個更好的開發者?