有同也有異,對比BAT的運維文化

tianxiaoxu發表於2018-08-31

相信做運維的童鞋都會有這樣的經歷,“參加過7*24小時的值班,抗過機器,敲過程式碼,偶爾還得玩兩下資料。”在一些小公司中,運維童鞋不敢說是全才,但至少是哪裡有坑就能夠填哪裡。但是,在大公司中運維工作的分類就比較細,例如專注於高反覆度工作的操作運維、專注於基礎運維工作的業務運維、專注於運維工作專案管理及需求規劃設計的規劃運維、專注於運維工具開發的開發運維等等。

大公司中的運維工作不僅面臨著分工的紛繁複雜,同時還要經受著峰值流量的衝擊。那麼,大公司的運維工作都是如何管理的呢?本文將以BAT為例,為你揭開大型網際網路公司運維思想的冰山一角。

騰訊:服務化、標準化、自動化和產品化

當運維團隊只有幾個人的時候,大家的工作狀態可能是“個人自掃門前雪”,哪裡需要救火就去支援哪裡,但是當團隊人數增加到成百上千人時,如果還是這樣的工作狀態,那可能就會有很大的問題。所以騰訊的運維服務有一個“四化建設”,即服務化、標準化、自動化和產品化。

如何理解這“四化”呢?服務化指的是服務於業務,傾向於解決產品的痛點;標準化是自動化的基礎,因為業務架構之間的差異各不相同,所以標準化的粒度和維度也需要進行調節;自動化,一定要打通企業內的各個資訊孤島,只有實現了全流程的自動化才是真正的自動化;產品化,運維平臺也要重視使用者互動,要以產品的理念來建設。

百度:書同文,車同軌,行同倫

從網上公開的資訊來看,百度的運維經歷了四個階段,即指令碼工具、基礎運維平臺、開放運維平臺和智慧運維平臺,運維的核心目標也從之前的提升效果過渡到現在的如何解放運維自身的效率。

在SACC 2017大會上,來自百度的講師曾透露,“百度指導運維的三個思想分別是書同文、車同軌和行同倫。”如何理解呢?書同文指的是一致運維“語言”,如運維應用、服務、機房、叢集的定義;車同軌指的是一致運維“方法”,如擴縮容執行、流量切換執行;行同倫指的是一致運維“模式,如故障診斷策略、彈性伸縮策略、流量排程策略。

上圖是百度AIOps技術棧,據悉該平臺應用於百度的內部、公有云和私有云客戶。

阿里:普適的“大中臺和小前臺”

似乎每家公司運維的“打怪升級”路線都很相似,阿里也經歷了指令碼化、工具化、DevOps、自動化再到智慧化的過程。在DTCC 2018大會中,阿里技術專家徐小飛曾將AIOps無人運維和無人駕駛進行了類比,二者都可以分為六個階段,並且每個對應的階段都有相同之處。其中AIOps無人運維的六個階段分別是人肉運維、指令碼/工具化運維、平臺型運維DevOps、資料化運維DataOps、高度智慧運維AIOps和完全智慧運維AIOps。

瞭解阿里的人應該都聽過,“大中臺和小前臺”這個名詞,這是阿里上上下下所有技術相關的部門都奉行的技術戰略,運維也不例外。

阿里有個大資料運維解決方案叫Tesla,該解決方案貫穿了阿里整個大資料體系,負責從基礎設施到基礎平臺到儲存計算平臺的所有產品的運維支撐。運維垂直體系也是一個SPI的分層結構,運維IaaS層負責的是提供面向運維管理的基礎操作能力;運維PaaS層提供面向各運維領域的功能服務以及運維資料來源與控制服務;運維SaaS層提供面向場景化的自動智慧運維應用。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31137683/viewspace-2213328/,如需轉載,請註明出處,否則將追究法律責任。

相關文章