如何做到 IT 基礎架構軟硬體升級簡單又不停機?

SmartX超融合發表於2022-05-17

在 IT 基礎架構日常運維中,升級是最頭疼的任務之一。這裡的升級既包括硬體的韌體升級,也包括軟體的版本升級,還有補丁的升級。這類工作通常伴隨著一些潛在停機或者故障的風險,甚至升級操作本身就要求停機執行,這給企業的關鍵業務帶來了不少的麻煩。因此,運維管理員對於升級操作可以說是慎之又慎,能免則免。

但現實中卻存在一些難以避免的升級需求,例如:

  • 當前使用的軟體版本發現明顯的漏洞時,企業需按照監管要求自行整改升級
  • 企業使用的硬體裝置達到退役年齡,效能、穩定性明顯下降
  • 企業使用的基礎架構在應對特殊場景時效能不佳

因此,企業需要在進行基礎架構必要升級的同時,儘量降低升級停機對企業業務連續性帶來的影響。在傳統虛擬化架構下,一種可行的不會造成業務中斷的升級策略是利用 VMware vSphere 的熱遷移功能,將虛擬機器在開機狀態下從原有儲存位置遷移至新的儲存位置,在這個過程中升級軟體或直接完成硬體升級。但這一策略在具體執行時依舊存在以下問題:

  • 運維投入大

傳統虛擬化架構下,虛擬機器的遷移需要一臺一臺手動完成,每次操作又包含 5-6 個步驟,對於一些有著兩三百臺虛擬機器的大型企業來說,IT 人員需要消耗相當多的時間精力。同時,對於集中式儲存架構,升級操作對於運維人員的技術能力要求較高。由於此類升級需要在命令列裡面操作,管理員需要足夠了解儲存的命令列是如何使用的。況且,即使能夠做到在不停機的情況下完成基礎架構軟硬體升級,多數企業——尤其是金融行業——依舊會準備停機升級的應急方案,以保障業務不會中斷。這就要求運維人員花費大量時間做升級計劃、等待評審會通過方案,使得每一次升級都變成運維人員的“攻堅戰”。

同時,對於企業來說,基於 VMware 熱遷移升級基礎架構的方案會帶來額外的資源投入。由於遷移過程中需要用到更多的交換機埠,企業原有的交換機可能無法支援整個遷移工作,需要進行額外採購。而這些裝置一般只作臨時使用,升級結束後使用機會較少,易造成 IT 資源浪費。

  • 業務中斷可能性

通過 VMware 熱遷移升級基礎架構依舊存在一定的業務中斷可能性。由於遷移過程涉及較多手動操作,出現人為失誤的可能性也大大增加,並最終導致整個升級的失敗。

  • 難以彈性投資

在進行硬體升級時,企業常常一次性更新整套新裝置,對於資源緊張的企業來說,無法做到按需投資、彈性升級。

那麼,如何才能在不停機的前提下簡單、高效、靈活地實現 IT 基礎架構軟硬體平滑升級?這項很多運維人員認為不可能完成的任務,SmartX 已經在諸多客戶生產環境中實現。與傳統虛擬化架構不同,SmartX 超融合架構支援軟體一鍵升級功能,並可通過異構擴容和資料遷移實現硬體平滑升級,有效降低軟硬體升級帶來的停機風險,減輕運維人員壓力,讓企業 IT 技術輕鬆迭代,助力企業業務持續升級。

軟體一鍵升級

案例 1

應監管通告要求,某期貨公司需要進行 IT 基礎架構軟體升級。在傳統虛擬化架構下,為了不影響業務執行,期貨公司需要在深夜或業務外的時間停機並手動完成升級。而 SmartX 超融合軟體升級能做到業務“0”中斷,支援該期貨公司在下午 3 點期貨交易結束後的半個小時內開始升級。整個升級過程僅花費 2.5 小時,平均一個節點升級僅需 20 分鐘,順利在下午 6 點下班前完成升級。同時,由於軟體升級不需要停機,運維團隊僅需內部通過升級方案即可開始升級,免除了複雜的停機審批流程。

這一案例中,客戶使用了 SmartX 超融合核心軟體 SMTX OS,利用一鍵升級功能在不停機的情況下完成了叢集升級。這一操作的實現有賴於軟體升級功能的以下特點:

  • 自動化升級:整個升級過程可線上進行,並預先進行環境檢查。能夠自動對軟體逐一進行升級、重啟等操作,減少人工操作帶來的差錯。
  • 無中斷升級:採用滾動升級方式,通過升級控制元件對節點升級進行控制,保證滾動升級正確性且業務無中斷。
  • 相容性保障:SMTX OS 各個版本保證了軟體的向後相容,在升級過程中允許節點間版本不一致,並保證不會對叢集已有業務產生影響。
  • 升級期間資料恢復最小化:在保證資料安全性的同時降低資料恢復量,避免叢集出現大量資料恢復而造成升級時間過長。

軟硬體平滑升級1.jpg

SmartX 超融合支援軟體一鍵升級(點選瞭解特性詳情)

硬體平滑升級

案例 2

五礦期貨有限公司(以下簡稱“五礦期貨”)是國內註冊資本最大的期貨公司之一。隨著業務的快速發展,五礦期貨基於 SmartX 超融合軟體先後三次擴容、利舊並升級硬體裝置。2018 年,五礦期貨利用 SmartX 超融合軟體在超微四子星上部署 4 個節點,構建原始叢集;2019 年第 1 次擴容,基於 PowerEdge R740xd 部署 2 個節點,實現了不同伺服器之間的異構擴容;2020 年基於老舊伺服器硬體 PowerEdge R730 部署 4 個節點完成第 2 次擴容;2021 年,通過繼續擴容 Dell R740xd,然後利用 SmartX 超融合資料遷移的機制,逐一替換超微四子星。在整個過程中,五礦期貨在保障業務“0”中斷的情況下,完成硬體升級替換。

軟硬體平滑升級2.jpg

五礦期貨硬體平滑升級流程(點選閱讀案例)

這一案例中,企業利用 SmartX 超融合支援叢集異構和資料遷移,對節點進行線上擴容並線上替換老舊伺服器,實現了基礎架構硬體隨企業業務發展持續動態升級。這一硬體升級過程包含如下特點:

  • 彈性擴充套件:3 節點起步,可基於部件或者節點進行擴容,並可整合不同品牌伺服器進行異構擴容,整個擴充套件過程“0”中斷。
  • 無中斷升級:利用資料遷移的機制,虛擬機器及其副本可快速遷移至其他節點,在全部遷移完成後下線老舊硬體,並在叢集中接入新硬體,完成硬體平滑升級。整個過程不停機,且僅在節點遷移及老舊硬體下線時涉及少量手動操作,大幅縮短升級時間,減輕運維壓力。
  • 資料自動均衡:新增節點或遷移虛擬機器後,動態平衡叢集內資料分佈,快速恢復分佈均衡。

點選下載《 》,瞭解更多詳情。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69974533/viewspace-2894889/,如需轉載,請註明出處,否則將追究法律責任。

相關文章