報告下載:新增199IT微信公眾號【i199it】,回覆關鍵詞【全排程乙太網技術架構白皮書】即可下載

《全排程乙太網技術架構白皮書》旨在推動面向未來智算中心的新型全排程乙太網技術方案,希望能夠助力產業突破智算中心網路效能瓶頸,打造無阻塞、高頻寬、超低時延的新型智算中心網路,助力AIGC等高效能業務快速發展。

智算業務普遍採用分散式平行計算進行訓練,而並行模式均需要多個計算裝置間進行多次集合通訊操作,AI訓練中通常採用同步模式,多機多卡間完成集合通訊操作後才可進行訓練的下一輪迭代或計算。在這個過程中,不管是拉取資料樣本還是計算節點間進行模型引數同步,都需要高效能、低時延的網路。智算中心網路作為底層通訊連線底座,成為智算中心提升算力效能的關鍵因素。

隨著智算業務的發展,智算中心的資料流更加複雜多變,現有基於流的負載分擔技術很容易會造成雜湊路徑上負載不均,導致網路有效頻寬低、時延抖動大,一旦網路效能不佳,就會影響AI訓練的質量和速度。面向未來智算中心規模建設和AI大模型發展及部署需求,如何打造無阻塞、高頻寬、超低時延的高效能網路成為提升算力水平的關鍵,也成為當前國內外資料中心網路領域創新焦點。

中國移動研究院主導提出的全排程乙太網技術架構,在最大限度相容現有乙太網標準的前提下,將高效能運算需求融入乙太網。創新性提出報文容器(PKTC)概念,以及從“流”分發到“報文容器”分發轉變、從“推”流到“拉”流轉變、從“區域性決策”到“全域性排程”轉變三大核心理念,構建出全網流量有序排程、鏈路頻寬高效利用、網路狀態精確感知的高效能網路。徹底解決了傳統網路技術負載不均,公平排程難、擁塞控制能力不足等技術難題,為智算中心高效能網路發展奠定了基礎。

為推動GSE架構完善和產業支援,中國移動聯合信通院、騰訊、清華大學、鵬程實驗室、華為、中興、銳捷、新華三、中信科、Intel、Marvell、盛科、思博倫等國內外公有云、裝置商、晶片商、測試儀表商等共同研究了該技術方案的技術特性,初步達成了產業共識。

後續中國移動將繼續完善技術方案,加快國際國內標準化程式,加速推動產業生態成熟,形成完整的生態鏈,推動商用程式。

報告下載:新增199IT微信公眾號【i199it】,回覆關鍵詞【全排程乙太網技術架構白皮書】即可下載