運維工程師核心工作是什麼?用什麼運維工具好?

行雲管家發表於2021-08-12

很多企業都有自己的運維工程師,但仍有很多工程師不清楚自己的職責,不知道核心工作是什麼,導致運維工作很混亂,很忙碌,天天加班。今天我們就簡單探討一下,運維工程師核心工作是什麼?用什麼運維工具好?

運維的核心工作其實就是為了維護IT裝置和系統的穩定,甭管硬體、網路、安全什麼的,無論黑貓白貓抓到老鼠就是好貓。

這裡有一點要說下,雲端計算時代下的運維和傳統運維在工作內容還是有差距的,從過去的機房、交換機、儲存、頻寬等實體設施,到雲服務上的虛擬產品,從實到虛的變化,更多的工作其實在操作端,雲主機資源的模板化,為不同業務團隊配置效能合適的主機模板,以及主機資源申請、建立、交付、運維以及最終的釋放銷燬的全生命週期管理,還有應用程式和支援軟體的安裝部署/交付和升級,叢集效能負載均衡調配、伺服器的批次指令碼操作、資料庫維護、主機的監控、運維日常工作的審計等等,當然了,多雲情況下,各雲使用的費用情況也需要統計和分析。

而這其中,如何及時發現問題,並在問題造成事故之前就解決了才是最難的,這就需要我們擁有事前監控、事中處置的運維能力,當然了,好的運維工具就必不可少。

1)事前監控與告警

行雲管家支援多種監控資料獲取方式:支援從公有云廠商/私有云平臺透過API獲取監控資料,也支援透過行雲管家Agent獲取監控資料,同時也對接瞭如SNMP等第三方監控平臺API對資源的監控資料進行獲取。

行雲管家覆蓋支援了幾乎所有的監控指標,包括CPU、記憶體、磁碟、程式、網路流量等20多項監控指標。

支援手機簡訊、電子郵件、微信/企業微信、釘釘等多種實時告警手段,且不僅僅止步於告警事件的通知,還提供了進一步的告警處理能力,運維工程師可直接透過移動終端即可對故障進行處理。

2)事中自動化運維處置

在自動化運維方面,行雲管家支援業界知名的 SaltStack/ansible運維工具庫 ,並支援使用者新建各類自定義Shell/Python/PowerShell/CMD指令碼,能夠批次對主機執行指令碼、命令,以及將檔案批次分發至目標主機、批次從多臺主機採集檔案,實現對多臺主機的各種批次運維操作。

同時,使用者可以根據業務要求編排運維任務,設定各種觸發條件,一旦觸發後,系統能夠自動執行相應的已編排好的任務,例如:雲主機自動升級、應用自動部署等,極大的降低應用部署與管理成本,提高業務敏捷性,滿足企業使用者對自動化運維的需求。

A、命令控制檯

命令控制檯提供了一種輕量化的批次執行命令的方法,可同時對多臺主機批次執行命令。使用者無需提前編寫命令,而是可以隨時對所選主機執行任何命令,並實時檢視命令輸出,主機輸出介面更友好。

B、指令碼控制檯

透過指令碼控制檯可以將預定義的指令碼匯入到行雲管家中的主機上執行,實現同時對多臺主機批次執行指定指令碼的功能,並支援指令碼的自定義。

C、會話控制檯

可同時批次開啟多臺主機的會話,將日常高頻運維的主機加入會話控制檯中,方便日常批次開啟會話的場景。

D、檔案分發與採集

將檔案批次分發到指定主機,或將指定主機的檔案採集到指定位置,適合主機批次打補丁/批次採集應用日誌等場景。

E、任務編排與執行

將需要執行的作業流程化、模板化,並可指定規則按需執行。

轉載:


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70002658/viewspace-2786641/,如需轉載,請註明出處,否則將追究法律責任。

相關文章