vSAN 是 VMware 推出的軟體定義儲存方案,透過聚合 vSphere 叢集中 X86 伺服器的本地磁碟並形成一個抽象的儲存池以供虛擬機器/容器等負載使用。VMware vSAN 最早於 2014 年釋出,至今已過去 10 年時間,每一年裡都發生了許許多多的變化,有的可能是版本功能的增強,有的可能是新功能新特性的增加。比如,在 2022 年的時候釋出了 vSAN 8 並推出了全新一代 vSAN Express Storage Architecture(ESA)超融合基礎架構,與 vSAN Original Storage Architecture(OSA)架構相比,這種架構可以帶來更高的硬體效能、可擴充套件性以及易用性;而在 2023 年的時候又推出了基於 vSAN ESA 的全新 vSAN Max 分解儲存型別,與 vSAN HCI 型別相比,這種使用方式透過將計算和儲存資源進行解耦,以充分利用 ESA 架構的各種優勢並專注於為各種工作負載遠端提供儲存資源。有關最近幾個 vSAN 版本之間的功能特性變化,如下圖所示:
VMware vSAN 通常每隔一段時間會發布一次新版本,透過不斷增強 vSAN 安全效能的同時也帶來了許多功能創新。最近結束的 VMware Explore 2024 Barcelona 大會上,VMware by Broadcom 再次討論了有關 vSAN 功能的新計劃,下面一起了解一下這些在 vSAN 9 或者 VMware Cloud Foundation 9 中可能帶來的新變化。
注意:以下內容僅代表 VMware 未來的計劃/願景,並不保證能夠真正推出以及什麼時候可以使用,所以請以官方釋出的正式通知為主。
1)vSAN Stretched Cluster:Automated Site Maintenance
vSAN 延伸叢集環境中,當想對一邊“站點”進行維護時,你可能需要將主機逐個置於維護模式,由於管理員需要手動完成這些動作,因此工作量會變得特別大,如果使用基於“站點”級別的維護模式,只需要點選一下,vSAN 會自動執行跨站點 vMotion 工作流並將指定“站點”內的主機進入維護模式;如果完成維護,當點選退出維護模式時,所有已遷移的虛擬機器會自動回遷至源站點。其次,如果手動按順序將主機置於維護模式,這個時候後面要置於維護模式的主機可能就會存在虛擬機器更新的副本資料,這樣就會導致前後置於維護模式的主機副本資料不一致的風險,當然如果後續正常退出維護模式並再次上線後,這些不一致的資料會重新進行同步,但是如果剛好另外一個站點發生故障,這個時候由於另外一個站點具有最新的副本資料,當本站點內的主機退出維護模式後,前面置於維護模式的主機就不能去同步後面置於維護模式的主機副本資料了,如果使用 vSAN 站點維護,vSAN 會協調維護工作並確保“站點”內的資料保持一致。
2)vSAN Stretched Cluster:Site Takeover
vSAN 延伸叢集環境中,當發生嚴重故障事故時,比如資料站點和見證站點發生同時故障的情況下,這裡有兩種情形,第一種是如果見證站點是在資料站點故障之後發生故障的,那麼這時候 vSAN 會將另外一邊站點上的票數拉高並讓虛擬機器保持可用;第二種是如果見證站點和資料站點“同時”發生故障的情況下,另外一邊站點就沒法繼續讓虛擬機器繼續執行了,HA 會自動將虛擬機器關機直到有一邊站點或全部站點恢復後,再重新選票並恢復虛擬機器的可用。在這種極端情況下,如果還想讓任然處於活動站點上面的虛擬機器繼續執行,這個時候使用 vSAN 站點接管就能解決這個問題,即便虛擬機器的物件票數不夠的情況下,也可以允許你手動(UI/指令碼)通知 vSAN,然後由 HA 協調開啟能夠恢復執行虛擬機器的電源。
3)vSAN Remote Protection
vSAN Data Protection 是在 VMware vSAN 8 U3 引入的基於 vSAN ESA 的新功能,藉助 vSAN Data Protection 功能,你可以在 vSAN 本地叢集建立虛擬機器的原生 vSAN 快照,並快速從操作故障或勒索軟體攻擊中恢復虛擬機器。除此之外,還支援整合使用災難恢復(DR)解決方案 VMware Live Recovery 中的 VMware Live Cyber Recovery,將本地 vSAN 環境中的虛擬機器 vSAN 快照複製到共有云(如 VMware Cloud on AWS)中,根據需要時可以即時恢復本地站點。如果增加 vSAN Remote Protection 功能之後,vSAN Data Protection 功能將與原生的 Replication 功能以及災難恢復(DR)解決方案 VMware Live Recovery 中的 VMware Live Site Recovery(之前叫 SRM)整合,以支援並完善本地資料中心的遠端保護。這些功能將統一由一個 vSAN Data Protection Snapshot Appliance 來實現。
4)vSAN Storage Clusters:Storage Traffic Isolation
VMware vSAN 分解儲存環境當中,客戶端(vSphere)叢集透過遠端掛載伺服器端(vSAN)叢集上的儲存,這裡之間互聯的儲存網路可以區分為兩個,一個是客戶端儲存網路(Client Network),另一個是伺服器端儲存網路(Storage Network)。伺服器端由於自身是 vSAN 儲存叢集,所以這裡需要專用的 vSAN 儲存網路,由於客戶端需要遠端掛載伺服器端的 vSAN 儲存,所以客戶端叢集與伺服器端叢集之間的 vSAN 儲存網路可以被理解為客戶端儲存網路,這個客戶端儲存網路主要由虛擬機器產生資料流量。由於伺服器端 vSAN 儲存網路具有非常高的流量,而客戶端叢集也同時需要向伺服器端的 vSAN 儲存進行讀寫,這樣一來就有可能會導致虛擬機器儲存讀寫的不穩定。如果進行客戶端儲存網路和伺服器端儲存網路的隔離,這樣既能保證虛擬機器不受伺服器端儲存流量的影響,也能提高網路安全性。這與 vSAN 延伸叢集中將 vSAN 見證流量進行分離的方式類似。
5)Disaggregated Compute & Storage High Availability
如果在 VMware Cloud Foundation 環境中使用了 vSAN 分解儲存方式,“伺服器端”使用了延伸叢集架構的 vSAN HCI 儲存型別或 vSAN Max 分解儲存型別,當“客戶端叢集”為 vSAN 計算延伸叢集(vSphere Stretched Cluster)時,如果客戶端和伺服器端任意一邊的某一個站點發生故障時,將自動完成計算和儲存在資料中心級別的高可用性,最終實現關鍵應用程式的 0 RPO 以及較低的 RTO。
6)Federated Storage Operations
VMware Cloud Foundation 9 中的聯合儲存檢視,在此檢視中能夠檢視所有站點上的儲存分佈和健康狀況、容量使用情況以及關鍵警報等。除此之外,針對工作負載域中使用了 vSAN 延伸叢集架構的場景,在聯合儲存檢視中支援視覺化地圖,能夠直接清晰明瞭的看到每個站點的詳細資訊以及拓撲分佈情況。
7)Federated Data Protection
VMware Cloud Foundation 9 中的聯合資料保護,針對於 VCF 環境資料保護和恢復的集中主頁,比如支援前面所說的 vSAN Remote Protection 功能,你可以在一個地方檢視所有受保護的 vCenter 和即時恢復區域,並獲得所有區域的重要保護警報通知。
8)Federated Performance Monitoring
VMware Cloud Foundation 9 中的聯合效能監控,用於監控 VCF 站點中所有 vSAN 效能的集中式儀表板,一站式排除所有 vSAN 效能故障。由於 VCF 9 中將與 Aria Operations 雲管平臺合併統一為一個 UI,所以在新的 UI(VCF Operations)中可以直接進行儲存相關的監控和故障排除等工作流。
9)Multi-Site Performance Insights
VMware Cloud Foundation 9 中的多站點效能分析,用於對存在儲存效能問題的叢集進行故障診斷,並主動最佳化和監控效能。由於 VCF 9 中將與 Aria Operations 雲管平臺合併統一為一個 UI,所以在新的 UI(VCF Operations)中可以直接進行儲存相關的監控和故障排除等工作流。