華為雲AI原生基礎設施CloudMatrix亮相全聯接大會

新闻助手發表於2024-09-20

今天,在華為全聯接大會 2024 上,華為雲釋出了 AI 原生雲基礎設施架構 CloudMatrix,以滿足 AI 時代企業對於算力的大規模、高效穩定、彈性靈活的需求。

華為雲AI原生基礎設施CloudMatrix亮相全聯接大會華為雲 AI 原生雲基礎設施架構 CloudMatrix 正式釋出

如今,AI 算力需求高速增長,正在超越對通用算力的需求。構建彈性、高效的多元算力基礎設施是 AI 發展的關鍵。

為了進一步提升 AI 原生基礎設施的效能,華為雲推出 AI 原生雲基礎設施 CloudMatrix,將 CPU、NPU、DPU、儲存和記憶體等資源全部互聯和池化,構建「一切可池化、一切皆對等、一切可組合」的分散式對等全互聯架構,實現了單體算力向矩陣算力的演進,為客戶提供澎湃的 AI 算力。

一切可池化:華為透過 CPU、NPU 為客戶提供強大的通用計算和智慧計算。同時,華為雲分散式 QingTian 技術幫助突破單伺服器的能力邊界,將伺服器內的 CPU、NPU、DPU、儲存和記憶體等多樣資源的統一池化並靈活配置,以此形成大規模、緊耦合的多元算力池化架構,算力得到大幅提升。

一切皆對等:CloudMatrix 透過超高頻寬 ScaleUp 網路從「傳統乙太網」向「共享匯流排乙太網」演進,實現池化算力的高速互聯,同時透過自適應拓撲感知打破叢集線性度瓶頸。華為雲在傳統算力叢集 ScaleOut 網路基礎上,結合 ScaleUp 超高頻寬網路,將資源互聯頻寬提升了一個數量級。新的網路協議實現跨物理伺服器的統一標識、統一的訪問和訊息通訊機制。從而實現 CPU、NPU、儲存 記憶體等多樣資源的跨伺服器統一池化。透過資源全部對等連線,既可以水平擴充套件,更可以垂直擴充套件,打破計算叢集線性度的瓶頸,能夠降大模型訓練叢集的線性度提升至 95%,網路故障分鐘級恢復。

一切可組合:CloudMatrix 可以按需組合多樣化算力資源,並且根據應用需求靈活調整。在統一多元算力邏輯池化、高速全對等互聯的基礎上,透過瑤光智慧雲腦對雲上資源進行多元算力統一建模、靈活排程組合,按需提供給應用。覆蓋大模型和小模型的訓練和推理,同時,還能夠用在資料分析、媒體內容生成等更多應用場景。

華為雲宣佈,基於 CloudMatrix 的新一代昇騰 AI 雲服務將於年底上線。

相關文章