面向微服務創新,IPU正成為未來資料中心裡起舞的精靈

naojiti發表於2022-09-22

日耳曼神話中,有一種名叫戈蘭林(Gremlin)的小精靈。傳說這種精靈熟悉各種工具和機械,可以幫助能工巧匠完成種種工作,還可以提升工匠的技術,啟迪他們的發明精神。很多時候,工匠們的傳統方式方法到達一定瓶頸,就會祈禱小精靈出現,能夠幫助他們解決難題。

在我們這個時代,資料中心就是偉大的工匠,肩負著為千行百業打造計算、智慧基礎設施的重任。當資料重心遇到了工作瓶頸,可能也需要精靈加入他們的工作中。

近日,英特爾攜手百度智慧雲,釋出了《為基礎設施提供加速引擎 助力塑造未來資料中心》英特爾IPU平臺解決方案白皮書,主要解析了英特爾IPU架構的功能和應用,以及如何與百度智慧雲通力合作打造其全新DPU架構,幫助雲資料中心充分釋放算力,全面賦能雲服務創新。

AI與大資料時代,雲資料中心走向計算架構變革成為當務之急。英特爾IPU的釋出與實踐,可以保持基礎設施高效能、高利用率的同時,實現更靈活地資源調配,並使雲服務提供商能更快地轉向完全虛擬化儲存和網路架構,從而極大滿足雲資料中心的升級需求。

在白皮書當中,我們可以透過雲端計算中心的發展與挑戰-IPU的架構與技術優勢解析-英特爾與百度智慧雲攜手進行的實踐,三個維度來審視IPU的發展藍圖與價值期待。

資料中心裡,小精靈正待起舞。

雲數智變革:資料中心的壓力與瓶頸

雲時代正在蓬勃發展,全新的技術與產業變革正醞釀在雲端計算產業中。對於雲服務商來說,企業創新應用對雲資料中心既有能力提出更高需求。隨著 5G、AI、邊緣計算等前沿技術在更多行業獲得落地應用,企業級雲服務出現了許多新的變化與趨勢。比如說——

更呈分散式的雲服務部署:邊緣計算等技術的發展推動著雲服務由傳統的中心雲逐漸向“雲邊端”協同演進,更多雲服務被部署在貼近應用的邊緣端。

更為廣泛的雲服務應用場景:雲服務正成為更多行業的 IT 基礎設施之一,在智慧製造、智慧零售、雲遊戲等新業態中作為主力,支撐企業的數字化、智慧化創新。

在這些變化的推動,雲資料中心伺服器在管理與應用上面臨更多挑戰。

例如更多虛擬機器(Virtual Machine,VM)的部署使虛擬機器管理等管理任務變得更加複雜。同時,其能力輸出也逐漸從傳統單體式應用向微服務化發展,這也進一步提高了雲資料中心管理任務的複雜程度,進而佔用大量處理器資源。

既要對虛擬機器、微服務等開展高效管理,又要對相關的雲資料中心的網路、儲存等基礎設施實現加速,其中的複雜性和資源開銷水平不斷增加,傳統基礎架構已經很難滿足未來資料中心要求。

隨著微服務模型越來越多地用於雲資料中心的應用、儲存和網路工作負載。可以預測的是,

未來資料中心需要進行以下方面的轉型和升級:

1.雲原生應用的出現和快速增長推高了對專用基礎設施的需求,並大幅提高雲服務的敏捷

性以及雲資料中心的效率。

2.雲服務的微服務化,推動了分散式異構計算環境的發展,而每個微服務都應在更適合其

的加速節點上執行。

3.微服務模型的廣泛採用也催生出資料中心編排系統,使各異構計算伺服器之間實現微服務分發的自動化及管理。

4.使用微服務、虛擬機器、容器以及容器編排的場景不斷增加,推動了服務網格的開發。服務網格能夠簡化微服務到微服務的通訊,並使其更加高效。服務網格已經成為雲原生堆疊的標準組成部分。

因此,未來資料中心的架構將更多地面向於微服務且日益分散的應用環境而設計,以此來更好利用異構計算帶來的加速處理能力。整體而言,未來資料中心架構需要面向微服務與分散應用環境設計,透過異構計算的方式來使資料中心算力設施各司其職,適應分散式部署的特點和需求,以此來應對雲時代的產業升級壓力。

這種情況下,IPU的誕生與發展就成了順理成章的事情。

精靈起舞:IPU為資料中心獻上時代之變

資料中心在目前階段必須要完成新的升級與演變,尤其要有新的計算機構出現。未來的資料中心,需要實現大規模分散式異構計算協同工作、無縫連線。尤其是處理基礎設施加速的計算單元可以有效負載分擔CPU的工作,對於資料中心效率提升至關重要。

2021年,英特爾推出了基礎設施處理器(IPU)。作為一種可程式設計網路裝置,英特爾IPU能夠助力雲和通訊服務提供商以及企業提高安全性、節約開銷並充分釋放中央處理器(CPU)的效能。藉助英特爾IPU平臺,資料中心可以透過安全、穩定、可程式設計的解決方案更好地釋放計算資源,並實現更高的安全性和隔離性。IPU這個幫助資料中心釋放算力的小精靈,可以為雲資料中心的微服務創新帶來多項優勢。

作為全新的產品形態。英特爾IPU在涵蓋智慧網路卡功能的同時,更能為未來雲資料中心帶來更高階別的安全性和控制力。其優勢包括:

1.減少了主機側處理器中虛擬機器管理程式和基礎設施堆疊的開銷,使更多的處理器資源可用於應用和租戶工作負載。

2.從主機側處理器中解除安裝了儲存堆疊,從而為應用和租戶工作負載釋放更多處理器資源。

3.解除安裝了高密集的基礎設施任務,如加密和解密以及資料包處理。

4.在極端情況下,英特爾IPU可以解除安裝整個虛擬機器管理程式,釋放 處理器所有核心為應用和微服務提供支援,這對於裸金屬服務產品來說至關重要。

5.為裸金屬和雲主機統一雲管控創造了可能。

從技術架構角度思考, 英特爾IPU能夠為雲資料中心帶來一系列發展優勢,是因為資料中心能夠有效地將網路、儲存、安全以及基礎設施管理等多種能力從處理器解除安裝到 英特爾IPU,從而實現算力釋放,並加速多種基礎設施能力。這些能力包括——

1.網路加速:將承載網路 I/O、資料轉發等功能的虛擬交換機軟體,如 OVS 等從主機側處理器解除安裝到 IPU,提升網路吞吐量,減少網路處理時延。

2.儲存加速:將 virtio-blk、NVMe-oF 等儲存介面、協議棧從主機側處理器轉移到 IPU,提高儲存彈性和靈活性,並降低系統複雜性和開銷。

3.安全加速:從主機側處理器解除安裝大量加密/解密、壓縮和其他安全功能。

4.基礎設施處理: 將雲服務管理功能從主機側處理器解除安裝到英特爾 IPU,使虛擬機器、容器或裸金屬服務的分配和管理更為高效。

除了引入效能更強、且具備靈活可程式設計特性的硬體來面向特定功能進行最佳化加速,釋放更多

寶貴算力之外,英特爾也賦予了 IPU 產品豐富的軟體生態。目前,英特爾正以加速開發平臺(Acceleration Development Platform,ADP)為抓手,透過更優生態系統的構建,助力合作伙伴實現雲資料中心效能加速解決方案的快速開發和部署。在規劃中,ADP 平臺將為使用者提供透過英特爾開放式 FPGA 堆疊(英特爾OFS)實現的板卡硬體設計、軟體、驅動程式以及技術設計支援。使用者可以利用這些軟體工具與技術支援,加速 IPU 相關產品的開發,並迅速將產品推向市場。

此外,需要注意的是處理器是資料中心的心臟。將英特爾IPU納入雲資料中心架構,可以有效發揮其與處理器之間的系統能力與平臺化價值。透過對接英特爾至強可擴充套件處理器,英特爾IPU能夠有效提升雲資料中心算力,充分釋放異構算力。

在英特爾為使用者提供的高效能雲資料中心生態方案中,不僅可以透過 IPU 開展能力解除安裝,對基礎設施進行效能加速,也可以引入英特爾至強可擴充套件處理器來進一步加強算力。透過對算力的“開源節流”,實現更快的資料處理速度、更大的頻寬接入能力以及更低的網路時延。

第三代英特爾至強可擴充套件處理器能夠為伺服器帶來的效能增強包括:

1.更多的核心、更優的架構帶來算力效能的大幅提升,可有效應對高密度計算所需;

2.支援更多記憶體,支援 PCIe-Gen4,可實現更高的每核 I/O 頻寬;

3.多項內建加速技術,如英特爾深度學習加速技術(英特爾DL Boost)等可在人工智慧等場景提供強大加速能力。

在算力架構中引入英特爾至強可擴充套件處理器的另一個優勢是能夠有效提升能力解除安裝的效率和平滑性。由於主機側和 IPU 都採用基於英特爾架構的處理器,就能夠非常方便地將主機側執行應用遷移到 IPU ,甚至無需編譯即可遷移,大幅提升開發、部署和測試的效率。

在基於IPU帶來的一系列價值之下,雲資料中心可以持續邁向微服務創新時代,打通未來資料中心之路。

助力巧匠:百度智慧雲的先驅探索

在白皮書中,我們可以看到英特爾IPU與百度智慧雲的合作案例與行業示範價值。從雙方合作中可以看出,百度智慧雲成功實現了提升伺服器效率,提升安全水平,降低算力綜合成本等價值。

在雲與AI帶來的數智化大潮中,雲服務持續向各個領域延伸,並承載越來越多核心業務能力。這也導致雲端計算服務商正面臨著需要更強算力資源、更大頻寬接入和更低網路時延的挑戰。與此同時,雲服務品牌也需要從計算架構革新中獲得價值,來確保自身的競爭優勢。為此,百度智慧雲提出雲智一體戰略,大力發展AI雲業務。而AI雲服務帶來的算力需求指數級提升。面向未來的元宇宙等需求,算力釋放還將面臨更多挑戰。

在這一程式中,百度智慧雲藉助英特爾FPGA 與英特爾至強D處理器帶來的高效軟硬體可程式設計的加速,首次推出了自研 DPU 裝置——百度太行 DPU1.0。其支援太行彈性裸金屬服務,包括網路解除安裝、PCIe 裝置熱插拔等功能,讓雲端計算的虛擬化開銷很大程度沉澱在網路卡上,使雲產品的效能大大提升。目前,太行 DPU1.0 產品已在太行彈性裸金屬等多種雲服務場景中開展應用,並獲得了使用者的良好評價。實踐證明,百度自主研發的百度太行 DPU1.0 可以有效解決雲資料中心管理及虛擬化的侷限性。

百度太行 DPU1.0 產品配備了 2 個 25G 頻寬的光口,並引入英特爾的FPGA 與英特爾至強D處理器作為算力核心,來實現了各項虛擬化功能的解除安裝,在為使用者提供彈性網路卡、彈性儲存能力之餘,還支援 1024 個裝置的熱插拔。同時,透過將雲管控平面解除安裝到百度太行DPU1.0 中,實現虛擬雲主機和裸金屬共池,即裸金屬可與虛擬雲主機被統一靈活排程。來自百度智慧雲的測試驗證表明,百度太行DPU1.0 產品能夠為使用者提供 1000 萬 PPS 的轉發率以及 20 萬 IOPS 的儲存效能。

面向未來,DPU 產品也將成為智慧雲服務的核心元件,助力IaaS資源的統一彈性底座,進而為使用者依託百度智慧雲開展各類業務創新、實施產業智慧化轉型提供可靠保證。

IPU帶來的架構革新,可以從基座層確保算力最大化釋放,釋放資料中心的核心競爭優勢。從2016年開始,“網際網路下半場”開始成為被廣泛討論的命題。如今,在規模化競爭進入收尾階段,技術創新與精細化服務成為主要競爭點的階段,“雲端計算下半場”似乎也已經到來。

在這一產業週期,雲端計算服務商的競爭力不僅在於基礎設施價效比,而是要面向客戶提供服務創新、技術創新以及綜合價值。這種情況下,雲端計算資料中心的基礎架構創新變得至關重要。它既是算力集約化的保障,也是業務創新的基石。

隨著英特爾 IPU 以及基於其參考設計研發的相關產品,在雲資料中心的基礎架構革新中展現出顯著效能優勢和市場價值,並逐步形成可持續發展的生態鏈,英特爾與百度智慧雲等深度合作伙伴也正圍繞雲服務的未來發展方向,從軟硬體層面開拓更多最佳化方案。例如透過新的英特爾IPU 平臺提供更大網路吞吐量,實現對硬體資源的全面解耦,以及以極低時延實

現端到端的加速等。

面向未來,英特爾計劃在 IPU 產品體系上持續發力。英特爾在 2022 年推出兩款第二代 200G 的可程式設計 IPU, 代號分別為“Oak Springs Canyon”和“Mount Evans”。其中Oak SpringsCanyon 搭載了英特爾至強D 處理器與英特爾Agilex™ FPGA 晶片。而Mount Evans 則是英特爾首款基於ASIC 晶片的IPU產品。這兩款產品都將具有解除安裝 200 G工作負載所需的基礎設施加速能力,且都可與英特爾至強可擴充套件處理器協同工作。未來兩到三年內,英特爾將推出支援 400 G的 IPU產品,並且在2025年或晚些時候,推出新一代基於 FPGA 晶片和 ASIC晶片的 800G IPU 產品。

與此同時,英特爾也正進一步背靠豐富的開源軟體(如基礎架構程式設計人員開發套件(International Package and Development Kit ,IPDK)、SPDK、DPDK 等),致力於透過開放的生態系統、多方位的行業協作以及積極的社群互動,讓百度等雲服務提供商、雲服務終端使用者以及其他合作伙伴能加速 IPU 相關解決方案的構建,從雲資料中心基礎架構的持續革新中擷取更大價值。

未來資料中心正在加速到來,而IPU正在成為其中翩然起舞的精靈。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2915859/,如需轉載,請註明出處,否則將追究法律責任。

相關文章