資料中心網路:什麼是Spine-Leaf架構?

陶然陶然發表於2022-04-19

  隨著傳統IDC向雲資料中心轉型,資料中心網路架構也在不斷演進。

  在傳統的大型資料中心,採用了層次化模型設計的三層網路。將複雜的網路設計分成幾個層次,每個層次著重於某些特定的功能,這樣就能夠使一個複雜的大問題變成許多簡單的小問題。三層網路架構設計的網路有三個層次:

  接入層(將工作站接入網路)

  接入層的物件導向主要是終端客戶,為終端客戶提供接入功能,接入層的主要功能是規劃同一網段中的工作站個數,提高各接入終端的頻寬。

  匯聚層(提供基於策略的連線)

  匯聚層連線網路的核心層和各個接入的應用層,在兩層之間承擔“媒介傳輸”的作用。在應用接入核心層之前先經過匯聚層進行資料處理,以減輕核心層裝置的負荷。匯聚層提供內容交換、防火牆、SSL解除安裝、入侵檢測、網路分析等服務。

  核心層(網路的高速交換主幹)

  核心層在網際網路中承載著網路伺服器與各應用埠間的傳輸功能,是整個網路的支撐脊樑和資料傳輸通道。核心交換機為進出資料中心的包提供高速的轉發,為多個匯聚層提供連線性,核心交換機通常為整個網路提供一個彈性的L3路由網路。

  通常情況下,匯聚交換機是L2和L3網路的邊界,匯聚交換機以下的是L2網路,以上是L3網路。每組匯聚交換機管理一個POD,每個POD內都是獨立的VLAN網路。當伺服器在一個POD內遷移時,不必修改IP地址和預設閘道器,因為一個POD對應一個二層廣播域。

  在匯聚路由器和接入交換機之間,使用生成樹協議(STP)構建二層網路的無環路拓撲。生成樹協議有幾個優點:它很簡單,是一種只需要很少配置的即插即用技術。但是,生成樹協議不能使用並行轉發路徑,往往會阻塞 VLAN 中的冗餘路徑。

  2010年,思科引入vPC(Virtual Port Channel)技術,消除了生成樹阻塞埠,提供從接入交換機到匯聚路由器的雙活上行鏈路,充分利用可用頻寬。但vPC也不能真正做到完全的水平擴充套件。

  使用 vPC 進行資料中心設計

  傳統三層資料中心網路挑戰

  三層網路架構因其實現簡單、配置工作量小、廣播控制能力強等優點,被廣泛應用於傳統 DCN。但隨著資料中心整合、虛擬化、雲端計算等技術的發展,傳統三層網路架構已經無法滿足網路的需求,主要原因有:

  無法支撐虛擬機器遷移所需的大二層網路構建

  無法支援流量的無阻塞轉發(尤其是東西向流量)

  虛擬機器動態遷移

  虛擬化技術從根本上改變了資料中心網路架構的需求。透過伺服器虛擬化可以有效地提供伺服器利用率,按需提供服務和資源,降低能源消耗,降低客戶的運維成本,所以得到了廣泛的應用。

  在虛擬化資料中心裡,一臺物理伺服器被虛擬化為多臺邏輯伺服器,稱為VM,每臺VM都可以獨立執行,有自己的OS,APP,也有自己獨立的MAC地址和IP地址。

  虛擬化出來以後,就產生了虛擬機器動態遷移的需求,虛擬機器動態遷移是指在保證虛擬正常執行的同時,將一個虛擬機器從一臺物理伺服器移動到另一臺物理伺服器的過程。該過程對於終端使用者來說是無感知的,所以要保證在遷移過程中,虛擬機器的業務不能中斷。

  虛擬機器在動態遷移時,不僅要求虛擬機器的IP地址不變、而且執行狀態也必須保持(例如TCP會話狀態),這就需要遷移的起始和目標位置必須在同一個二層網路域之中。

  由於限制,傳統資料中心的三層網路架構設計根本無法滿足伺服器虛擬化中更靈活的、可自定義的虛擬機器遷移策略。

  為了實現虛擬機器的大範圍,甚至跨地域的動態遷移,就要求把虛擬機器遷移可能涉及的所有伺服器都納用同一個二層網路域,透過虛擬化的技術形成一個更大範圍的二層網路。這樣才能實現虛擬機器的大範圍無障礙遷移,這種適合虛擬機器隨時隨地無障礙遷移的大範圍二層網路,我們稱之為大二層網路。

  資料中心的流量的轉變

  資料中心的流量總的來說可以分為以下幾種:

  南北向流量:資料中心之外的客戶端到資料中心伺服器之間的流量,或者資料中心伺服器訪問網際網路的流量。

  東西向流量:資料中心內的伺服器之間的流量。

  跨資料中心流量:不同資料中心的流量,例如資料中心之間的災備,私有云和公有云之間的通訊。

  在傳統資料中心中,業務通常採用專線方式部署。通常,服務部署在一個或多個物理伺服器上,並與其他系統物理隔離。因此,傳統資料中心東西向流量較低,南北向流量約佔資料中心總流量的80%。

  在雲資料中心,服務架構逐漸從單體架構轉變為Web-APP-DB,分散式技術成為企業應用的主流。服務的元件通常分佈在多個虛擬機器或容器中。該服務不再由一臺或多臺物理伺服器執行,而是由多臺伺服器協同工作,導致東西向流量快速增長。

  此外,大資料服務的出現使分散式計算成為雲資料中心的標準配置。大資料服務可以分佈在一個資料中心的數百臺伺服器上進行平行計算,這也大大增加了東西向流量。

  傳統的三層網路架構是為南北向流量占主導地位的傳統資料中心設計的,不適合東西向流量較大的雲資料中心。

  一些東西向流量(如跨POD的二層和三層流量)必須經過匯聚層和核心層的裝置轉發,不必要地經過許多節點。傳統網路通常設定1:10到1:3的頻寬超額比,以提高裝置利用率。隨著超額訂閱率,每次流量透過節點時效能都會顯著下降。此外,第 3 層網路上的 xSTP 技術加劇了這種惡化。

  因此,如果透過傳統三層網路架構執行大量的東西向流量,連線到同一交換機埠的裝置可能會爭奪頻寬,導致終端使用者獲得的響應時間很差。

  Spine-Leaf架構

  Clos 網路以其發明者Charles Clos命名,Charles Clos是一名電話網路工程師,他在 1950 年代需要解決如何應對電話網路的爆炸式增長這一問題. 提出了現在稱之為 Clos 的網路架構。

  一個簡單的兩層Clos網路

  Spine-Leaf體系架構是由Spine和Leaf這兩個交換層組成的資料中心網路拓撲結構。Leaf層由訪問交換機組成,匯聚來自伺服器的流量,並直接連線到Spine或網路核心。Spine交換機在全網格拓撲中互連所有Leaf交換機。上圖中,綠色節點代表交換機,灰色節點代表伺服器。在綠色節點中,最上面的是Spine節點,下面是Leaf節點。

  Spine-Leaf架構更適合滿足現代應用程式的需求,例如高吞吐量和低延遲。

  Spine交換機具有高吞吐量、低延遲且埠密集,它們與每個Leaf交換機都有直接的高速 (40-400Gbps) 連線。

  Leaf交換機與傳統TOR交換機非常相似,它們通常是 24 或 48 埠 1、10 或 40Gbps的接入層連線。但是,它們增加了到每個Spine交換機的 40、100 或 400Gbps 上行鏈路的能力。

  Spine-Leaf架構與傳統網路設計有何不同?

  傳統資料中心的網路通常基於三層模型:

  接入交換機連線到伺服器

  匯聚交換機為接入交換機提供冗餘連線

  核心交換機在匯聚交換機之間提供快速傳輸

  Spine-Leaf 架構減少了核心層,實現了層次的扁平化,如下圖所示。

  此外,關於Spine-Leaf 架構的其他常見差異如下:

  放棄了生成樹協議 (STP)

  越來越多地使用固定埠交換機而不是網路骨幹的模組化模型

  橫向與縱向基礎架構的擴充套件

  上文有提到如今東西向流量越來越多,低延遲、最佳化流量對於東西向流量的效能至關重要,尤其是在時間敏感或資料密集型應用程式中。Spine-Leaf架構的主要好處之一就是它允許資料流從資料的源到資料的目標路徑較短。無論源和目的地如何,Spine-Leaf結構中的資料流在網路上的跳數都相同,任意兩個伺服器之間都是Leaf—>Spine—>Leaf三跳可達的。

  由於Spine-Leaf 架構不再需要 STP,容量也得到了提高。其依賴諸如 ECMP(等價多路徑)路由等協議來平衡所有可用路徑上的流量,同時仍然避免網路環路。

  除了更高的效能外,Spine-Leaf 架構還提供了更好的可擴充套件性。可以新增額外的Spine交換機並將其連線到每個Leaf ,從而進一步增加容量。同樣,當埠密度成為問題時,可以無縫新增新的Leaf 交換機。在這兩種情況下,網路都不必為基礎設施的這種擴充套件(“橫向擴充套件”)而重新設計,也沒有停機時間。

來自 “ SDNLAB君 ”, 原文作者:SDNLAB君;原文連結:http://server.it168.com/a2022/0419/6657/000006657189.shtml,如有侵權,請聯絡管理員刪除。

相關文章