回首五年運維,運維需要思考

龍叔18歲發表於2020-12-18

如果我帶著記憶回到五年前踏出校門的時刻,我依然會選擇我現在的工作——運維工程師

2016年踏出校門的時候,我是帶著C++的職業目標走向一個又一個校招面試官的,或許是因為當時自己c++技術不足,又或者C++的校招崗位很少,大部分面試官都在問我:你願意做運維嗎?

當時我是猶豫的,但如果是現在的我,我會毫不猶豫的說:我願意

運維工作,可深可淺,全在自己選擇,有很多人不願意做運維,因為他們覺得運維的入門門檻太低,這沒有錯,但是他們卻沒有看到運維的深度和高度

運維的基本能力

在你想要讓自己的運維能力更上一層樓之前,下面運維基本的工作能力是最起碼的

  • 系統的上線,監控的部署(最起碼的知道該有的監控,以及為什麼監控,監控出現怎麼排查)
  • 故障問題處理能力,這是一個閉環的工作,不僅僅只是解決問題,更應該找出問題暴露的缺陷,這裡的缺陷不只是系統層面,也要檢視作為運維是否需要改進,如監控,如容量,如高可用等等
  • 各種中介軟體,資料庫的技能,最好是在某一個上有技術深度
  • 生產容量評估,這裡涉及壓測以及壓測方法的能力
  • 文件編寫的能力,不管是開發還是運維,都應該具有文件編寫的能力,作為系統運維,你應該會寫系統運維手冊

多年運維該形成的思維

如果做運維很多年了,你應該具有以下幾種思維

  • 排查問題的思維,在告警或者故障出現的情況下,有自己的定位,排查的一種流程方法
  • 高峰準備的思維,業務高峰點之前,怎麼準備,怎麼開展
  • 開展多人協作工作的思維,接收一個新的任務的時候,如何開展,如何進行,如何統籌協調
  • 系統優化的思維,不僅僅只是維護系統,你應該能夠憑藉你的經驗,發現系統的隱患,主動推動優化

創造價值的工作

除了基本工作之外,運維有太多事情可以去做了:

  • 運維最寶貴的就是處理問題的經驗,但是大部門運維只是讓它躺在自己的文件中,怎麼將他運用在生產中?告警匹配預案,自動處理?AI自定定位?出現故障自動匹配歷史問題,給與參考?
  • 監控應該怎麼去管理維護?按照監控手冊一個一個去部署?還是形成模板,自動化部署監控?
  • 監控應該怎麼做減法,去收斂?一刀切的去降低甚至不發低階別告警?還是監控告警處理情況,精準的找出無效的冗餘告警進行收斂?
  • 在擁有大量監控資料的情況下,怎麼實現動態監控,怎麼實現自動定位,怎麼運用這些資料創造價值
  • 作為運維,你應該掌握一門程式語言,具備開發能力,不一定要做運維開發,而是能夠在需要的時候,用開發技能實現或者說服務於自己的運維想法

不要只埋頭工作,多花一點時間,跳出來,思考一下:

思考一下運維工作的缺陷和不合理的地方
總結一下最近的工作
思考一下資料如何利用,如何產出價值
思考一下自己的職業追求

我的五年運維經歷,教會了我多思考

我 喜歡我的工作

相關文章