【運維自動化】37秒萬臺伺服器標準化與交付自動化

騰訊藍鯨智雲發表於2022-11-24

情景

對執行在上萬臺伺服器上的業務服務做標準化的調整

前提條件

  • 伺服器已在CMDB註冊
  • 擁有伺服器所在CMDB中業務的運維許可權

操作步驟

1.新建作業
2.執行和檢視執行結果

1. 新建作業

按照標準化的需求,我們需要將gsectl檔案推送至/usr/local/gse_bkte/agent/bin/目錄,為了確保萬無一失,做md5校驗。

作業模板如下:
在這裡插入圖片描述
提示:為了闡述作業平臺中的兩個全域性引數:IP 和 雲參,我們透過需求自助化中用到的作業模板來介紹。
在這裡插入圖片描述
IP這個引數,我們一般建議使用動態分組,因為伺服器會有故障替換的可能,IP會變。

雲參在指令碼中可以直接引用。

在這裡插入圖片描述

2. 執行作業及檢視執行結果

點選執行作業後,在9946臺伺服器上總耗時37秒。

在這裡插入圖片描述
其中分發gsectl檔案耗時13秒
在這裡插入圖片描述
md5校驗耗時24秒。

在這裡插入圖片描述

一次標準的應用交付自動化案例

情景

應用釋出是運維這個崗位的職能之一,釋出關聯多個ITIL系統的功能模組,比如釋出單、監控的告警遮蔽、DB變更、業務內公告、統一登入入口等,頻繁在多個系統間切換,不但影響效率而且容易出錯,同時無法視覺化檢視釋出進度以及事後的回溯。

接下來,一起看下標準運維是如何解決這些痛點。(有功能特性需要5.1環境)

前提條件

主機在藍鯨CMDB中管理

術語解釋

  • 流程模板 : 標準化的資源和應用交付模式,透過資源編排引擎,實現對資源的建立、配置,實現自動化交付資源或應用,行業中一般稱之為pipeline、資源編排模板,比如一次釋出任務可以編排為一個流程模板。
  • 標準外掛 : 多個執行節點透過編排規則實現流程模板,其中的執行節點稱之為 標準外掛,比如執行指令碼為一個標準外掛

操作步驟

1.梳理:梳理標準化模板

2.建模:新建流程模板

3.執行:執行流程

1. 梳理標準化模板

配置管理標準化中提到,運維服務“四化建設”的標準化包含配置管理、釋出、變更、故障處理、監控告警等場景的流程制定。以釋出為例,透過流程圖梳理應用交付的流程。

分為釋出前準備、釋出中、釋出後檢查三部分。

在這裡插入圖片描述

2. 建立流程模板

為了簡化演示,將流程圖中的關鍵節點在標準運維的業務流程模板中體驗出來。

選擇 [流程模板] -> [業務流程],點選 新建 來建立業務流程模板。

從左側標準外掛區,選擇釋出流程中需要的標準外掛作為流程的節點,比如執行作業, 向右拖動到畫布。

在這裡插入圖片描述

選擇作業平臺中準備好的 作業模板,然後新建 全域性變數,並將全域性變數填充到節點的引數中。
在這裡插入圖片描述
按照上述步驟,完成一個應用釋出的流程模板。

在這裡插入圖片描述
標準運維內建了CMDB、作業平臺、通知等標準元件,如果不在此列的,需要開發標準運維外掛來整合企業內部ITIL系統。

這裡重點說明 全域性引數 和 流程分支。

2.1 全域性引數

伺服器發生故障後,保障下一次應用釋出獲取最新的IP列表,可以透過IP選擇器實現。
在這裡插入圖片描述

2.2 流程分支

應用釋出過程中,執行成功 和 執行失敗的處理分支不同,可以透過流程分支功能對上一步執行結果為真或為假來判斷。

在這裡插入圖片描述
提前引用上一步流程節點的輸出引數執行結果,將其用於上圖中的流程分支表示式。

在這裡插入圖片描述

3. 執行流程

在業務流程列表中,點選新建任務

在這裡插入圖片描述
點選執行任務流程

部署藍鯨智雲

https://bk.tencent.com/download/

擴充套件閱讀

上下文傳參
將一個流程節點的輸出作為另一個流程節點的輸入。

比如第1步輸出 MD5值 ,第2步分發版本,第3步使用第1步中生成的 MD5值 來校驗版本的一致性,效果如下:
在這裡插入圖片描述
主要用到標準運維流程節點中的引用輸出引數(5.1版),引用第1步中的release_md5變數。

在這裡插入圖片描述
release_md5變數需要提前在作業模板中設定,如下圖:

在這裡插入圖片描述
在這裡插入圖片描述

藍鯨智雲簡介

騰訊藍鯨智雲(簡稱藍鯨)軟體體系是一套基於PaaS的技術解決方案,致力於打造行業領先的一站式自動化運維平臺。目前已經推出社群版、企業版,歡迎體驗。瞭解更多:https://bk.tencent.com/

相關文章