運維轉型之路 —手工運維到無人值守的自動化運維,從根本實現降本增效

北京智和信通發表於2022-12-02

運維伴隨資訊科技的發展而生,經歷了從手工管理到工具化運維,發展至平臺化運維,最終實現自動化、智慧化運維的四個階段。

 

圖一:運維發展階段及特點

在資訊化發展初期,業務流量不大,伺服器數量相對較少,系統複雜度不高。此階段缺少運維工具和操作流程、標準,運維工作的開展主要依賴於個人知識、技術及經驗的積累。

隨著伺服器規模、系統複雜度的增加,全人工的操作方式已經不能滿足業務的快速發展需要。此時運維進入工具化階段,在此階段運維流程、標準等開始建立,運維人員逐漸開始使用工具進行管理,針對不同運維操作出現了不同的指令碼程式。

在第三個階段,網路架構異構,運維需求迭代頻繁、快速,同時對於運維效率和誤操作率有了更高的要求,使用者開始建立運維平臺,進入平臺運維階段,此時,手工執行指令碼逐漸轉化為平臺化操作,運維資料更加可視,運維實現跨團隊線上協作,運維效率、質量有了極大提升。

在業務逐漸龐大、海量資料不斷積累的階段,隨著 AI技術的逐漸成熟,運維逐漸步入智慧運維( AIOps)階段,目前大多數使用者和運維廠商都處於實踐初期,基本實現單一場景智慧化、自動化處理,並向機器決策、無人值守運維模式探索。

以大資料為支撐,保障運維數字化轉型

隨著人工智慧技術的不斷深入,人的角色主動性不斷提高,對資料和平臺的掌控能力不斷增強。在採集到原始資料後,透過大資料分析視覺化,進行標識、編排、模型預訓練,將結構化的知識抽取,最終將專家的知識經驗衍生為可重複應用的知識體系,從而固化到平臺中,進而顯示運維平臺的自動化和智慧化升級。

 

圖二:北京智和信通自動化運維平臺架構

作為逐步進入智慧化運維階段的自主研發運維工具企業,北京智和信通技術有限公司重點關注“萬物互聯”理念,在傳統運維的基礎上,以更具智慧化、更具安全性為研發方向,形成全棧式立體運維監控產品體系。融合人工智慧、大資料、物聯網等技術,提取靜態資料 (歷史資料 )和動態資料 (實時、流式傳輸資料 ),透過資料採集、資料儲存、資料治理,聚合有效資料,配合自動化程式,逐步實現無人值守的運維響應。

AI智慧為武器,實現“真自動化”運維

近些年,運維更關注 使用者體驗, 重視 響應時間、可用率等效能指標 ,在對基礎設施、資料庫、中介軟體、儲存、物聯網等裝置進行運維監控時,需求更具擴充套件能力、模組化、可分散式部署的產品與解決方案,在故障發生時第一時間定位問題,快速進行根因分析。

北京智和信通自動化運維解決方案以萬物場景為基礎,以構建持續發展、萬物感知的智慧安全運維為目標,將網路拓撲、監控、安管、資產、資料分析、視覺化展示、日誌分析、工單、流量監測等核心產品以“積木式”的開發方式進行結合,在實際應用中根據使用者的需求場景靈活組合,實現“真自動化”運維。

(一) 萬物管控的基礎監控採集能力

以提供全方位網路監控功能,全面管理聯網裝置為目標,深入使用者需求,實現個性化網路監控解決方案。實現全棧不同型別、不同品牌、不同型號的 IT設施統一監控。可無限新增裝置監測指標。從應用系統、網路裝置、儲存、資料庫、中介軟體到應用、動環,全面監管。

 

(二) 複雜網路直觀展示的拓撲可視能力

自動生成拓撲圖,支援物理網路拓撲和邏輯網路拓撲,透過平面或立體的展示方式,直觀展示網路中各裝置、介面間連線關係。整體網路結構透明可視。

 

(三) 網路全流量資料分析展示

基於網路流量分析技術,採集、分析、儲存所有網路流量,透過回溯分析資料包特徵、異常網路行為,以多維資料分析和深度挖掘為手段,實現資料包層面的流量追蹤,發現潛伏於網路中的未知攻擊。

 

(四) 平臺級視覺化運維編排能力

提供視覺化編排工具,支援以拖拽的方式快速簡單的完成作業流程的配置,將複雜的運維工作和任務轉變為一致的,可複用的、可度量和有效的工作流,實現自動化運維。

 

(五) 故障實時預警,快速自愈

以網路故障監控、裝置效能監測為基礎,結合網路流量偵測功能,動態發現網路故障。智慧判斷告警型別及級別,自動觸發預設的故障解決流程,複雜告警指派工單專人處理,常規告警觸發安全策略全自動處理。

 

(六) 規範化、自動化安全編排

以安全裝置分析和異常告警安全事件為輸入,透過編排和執行安全作業流程的方式,將裝置安全事件的處理及內部事件管理流程進行結合,完成原來需要多人多系統多介面線上協同才能處置的安全事件,降低人員依賴,保障應急處置質量。

(七) 週期性作業排程自動執行

將週期性、重複性的批處理作業 ,如巡檢、應用部署等 ,固化為自動化作業流程,透過配置時間規則,在指定時間進行排程。從而實現週期性工作的自動化,僅需關注相應的作業執行過程、執行成功與否 以及 執行結果,規範大多數週期性運維操作。

(八) 深入裝置底層的控制和調配能力

深入裝置、資源、協議層面實現深度管控,基於多種協議進行統一安全管控、裝置控制規範配置。支援週期性、批次裝置控制策略執行,將繁複的裝置運維工作轉化為自動執行的管理策略,全面解放人力。

 

(九) 海量異構資料聚合分析呈現能力

提供視覺化資料分析能力,對網路海量資料進行圖形化分析展示。透過直觀的圖表和圖形化手段清晰有效的將運維資料分析結果進行傳達,幫助使用者由宏觀到微觀更快地瞭解網路運維現狀,做出更具時效性的決策。

 

(十) 運維工單高效協同流轉

結合使用者需求實現定製化運維工單,透過自動觸發與使用者報修等方式快速響應運維事件,解決突發故障和請求,實現整個運維流程規範化、標準化,運維協同高效透明,運維結果可查可控。

 

(十一) 資產全生命週期監管

透過 資產實物與運維資料庫 一一對應,為使用者提供更加便捷高效資產生命週期管理,資產跟蹤、維護和統計分析。動態 監測已 納入監控的資產執行狀態,並對資產執行情況進行分析,透過狀態資料採集分析,預估資產將面臨的風險,驅動資產維護保養。

以二次開發平臺為基座,支撐差異化敏捷部署

基於模組化的搭建形式,充分利用軟體已有功能,提供多種開發模式和可擴充的框架模組供使用者選擇。在通用功能的基礎上,開發人員選擇API或程式碼的開發形式,以便在最短的時間內滿足使用者各種定製需求,提高研發效率。

平臺內建 6種開發模式,超 50種開發元件,真正做到程式碼級開放,滿足各類運維場景的差異化需求。

結語

縱觀運維的發展,企業和使用者都希望運維工作高自動化起、智慧化,實現基礎資源合理利用,業務環節高效監控,異常自動分析處置,減少人的重複勞動,降低知識傳遞和儲存的成本,運維交付更加高效、更加安全。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011401/viewspace-2926488/,如需轉載,請註明出處,否則將追究法律責任。

相關文章