3U一體,英偉達DPU使資料中心成為新一代計算單元

陶然陶然發表於2021-06-22

  兩個月前,在NVIDIA GTC 2021峰會上,NVIDIA正式釋出了新一代資料處理器NVIDIA BlueField-3 DPU,為資料中心提供強大的軟體定義網路、儲存和網路安全加速功能。

  兩個月後,筆者有幸採訪到了NVIDIA網路事業部亞太區市場開發高階總監宋慶春和UCloud資深技術專家馬彥青,聽兩位跟我們分享了NVIDIA DOCA是如何實現從BlueField-3晶片級資料中心到三U一體超大規模資料中心的統一架構,以及UCloud基於NVIDIA DOCA生態的技術實踐。

   為什麼NVIDIA要推出DPU?

  隨著AI技術的普及和資料量爆發性增長,資料中心正在發生變革。從傳統的馮·諾依曼架構的資料中心轉向以資料為中心的架構,資料在網路通訊過程中,很多通訊模型會制約整個系統效能的發展,這就給我們提出了一個新的挑戰--如何繼續提升資料中心效能。

  網路計算以資料為中心的新的架構,幫我們解決了這個問題。以資料為中心的新的架構,意味著資料在哪裡,計算就在那裡;當資料在GPU上,計算就在GPU上;當資料在CPU上,計算就在CPU上;當資料在網路中傳輸的時候,計算就在網路中。

  透過這樣的方式就可以解決網路傳輸中多打一的瓶頸問題或丟包問題。新的架構可以使通訊延時降低10倍以上。所以,網路計算成為我們現在以資料為中心這種核心計算架構的關鍵技術之一。

  NVIDIA網路事業部亞太區市場開發高階總監宋慶春表示:“DPU的出現為以資料為中心的計算架構提供了非常創新的思路。以OVS操作為例,當我們run OVS在CPU上,會消耗很多CPU的核,但執行OVS的效率非常低,如果要把OVS操作放在DPU上可以把這個包轉發率大幅度提升,而把CPU利用率大大地降低。”

   BlueField-3構建下一代安全資料中心計算單元

  據宋慶春介紹,BlueField-3是業界第一款400G速度的DPU。在BlueField-3上,我們會出400G的Ethernet或者InfiniBand的介面。值得一提的是,在BlueField-3上可以來實現400Gb/s加解密的速度,不管是用IPSec還是用TLS,在加解密的速度上都可以達到400Gb/s的全線速。

  不僅如此,BlueField-3還整合16個ARM CPU的核,它有更powerful的處理器。從它整個Offload(解除安裝)功能來看,一個BlueField-3的DPU可以實現的offload功能可以相當於300個X86CPU的核,這樣我們原來需要很多CPU的核來做的操作,透過用DPU專業的offload engine,可以輕鬆地在DPU上面來實現,從而把這麼多的CPU核offload出來,還給業務。

  在儲存上可以實現18個million的IOP/s。現在儲存如果能達到1個million的IOP/s已經是非常高的效能,但在BlueField-3上,可以在不消耗主機CPU的情況下而達到18million的IOP/s。

   DOCA實現從單晶片到超大規模的資料中心統一架構

  據瞭解,DOCA軟體開發包是專門為DPU開發的軟體包。它的價值就像CUDA對GPU一樣,透過CUDA可以看到所有GPU的開發介面,可以對它做程式設計。

  DOCA也是如此,DOCA上各種業務,不管儲存還是安全,以及其他與使用者有關的業務都可以透過DOCA介面呼叫DPU裡Offload的Engine,安全、網路、儲存以及Orchestration,來對它進行程式設計。從DOCA的Vision來看,是想提供透過軟體定義把所有的硬體加速的engine都呼叫起來的Infrastructure服務。

  不僅如此,我們還可以透過DOCA來實現軟體定義網路,可以透過DOCA來實現軟體定義儲存,透過DOCA來實現軟體定義安全,無論是儲存、安全和網路,你都可以透過DOCA和BlueField硬體關聯起來,直接呼叫到硬體的加速引擎。

  從DOCA軟體棧來看,DOCA軟體棧主要有兩層:一是DOCA的driver和runtime,二是DOCA的Library,DOCA library主要是針對業務提供介面,在driver和runtime上,主要是怎麼樣呼叫硬體加速engine,怎麼樣將硬體的加速engine提供給上層的通訊庫。

  從DPU生態系統來看,已經得到了不管是作業系統廠商還是做應用的廠商,還是做安全、儲存各個廠商的廣泛支援。

   UCloud基於DPU構建下一代軟體定義資料中心基礎架構

  近年來,雲主機因其彈性、易用、低成本優勢逐漸成為企業部署業務的首選,但有些對業務效能要求極高的企業依然會選擇使用獨享的物理機。傳統的物理機固然具備天然的高效能和強隔離特性,實際上卻由於部署流程冗長、靈活擴充套件性較差而難以滿足企業高速發展的業務需求。為此,UCloud的裸金屬物理雲2.0就很好的解決了上述問題,其兼具物理機的高效能與虛擬機器的彈性。

  據UCloud資深技術專家馬彥青介紹,我們基於DPU&DOCA做的網路解除安裝。

  我們原先的網路架構使用的是VPC閘道器,作為裸金屬伺服器的VPC之間劃分的方法,這種方法會使用很多的閘道器伺服器叢集來進行管理,而這個叢集伺服器本身就面臨著一個成本,大概4-8臺一個小叢集,當跨閘道器的時候會存在頻寬的瓶頸。

  我們將原來的10G網路卡提升到現在DPU25G之後,它的效能也大大提高,在我們裸金屬2.0產品裡,做了雙網路卡的bonding之後,頻寬可以提高到50G。這樣在裸金屬網路架構裡使用了DPU之後,就可以和快傑雲主機網路使用相同的VPC管理方式,而且雙方之間可以進行直接互通,也提高了它的連線效率。

  不僅如此,UCloud還利用DPU和DOCA重構了UCloud裸金屬儲存架構。使用NVIDIA BlueField DPU提供的NVMe SNAP功能,將UCloud的雲端儲存產品RSSD呈現為本地的NVMe系統盤和資料盤,為物理雲客戶提供了更靈活易用的雲盤儲存服務,並且,UCloud的RSSD雲盤使用BlueField DPU成熟的RDMA能力,效能也達到了非常高的水平,真正實現了靈活性與效能的兼顧。

  馬彥青表示:“雙方在裸金屬物理雲的基礎上進一步探索虛擬化應用場景,DPI深度包檢測以及Micro Segmentation等應用場景,非常期待雙方的持續合作為市場帶來充滿創新和有價值的雲產品。”

  寫在最後,隨著網路計算和DPU的崛起,資料中心成為了新的計算單元。從計算到網路,從GPU到CPU和DPU,英偉達構建的“AI帝國”已經初步完成。誰掌握了計算和資料,誰就掌握了未來。在這條道路上,英偉達已經先走一步。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28285180/viewspace-2777788/,如需轉載,請註明出處,否則將追究法律責任。

相關文章