論IT運維自動化的重要性
概念
簡單的說,IT運維自動化是指基於流程化的框架,將事件與IT流程相關聯,一旦被監控系統發生效能超標或當機,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。自動化工作平臺還可幫助IT運維人員完成日常的重複性工作(如備份、防毒等),提高IT運維效率。同時,IT運維的自動化還要求能夠預測故障、在故障發生前能夠報警,讓IT運維人員把故障消除在發生前,將所產生損失減到最低。
背景
隨著資訊時代的持續發展,IT運維已經成為IT服務內涵中重要的組成部分。面對越來越複雜的業務,面對越來越多樣化的使用者需求,不斷擴充套件的IT應用需要越來越合理的模式來保障IT服務能靈活便捷、安全穩定地持續保障,這種模式中的保障因素就是IT運維(其他因素是更加優越的IT架構等)。從初期的幾臺伺服器發展到龐大的資料中心,單靠人工已經無法滿足在技術、業務、管理等方面的要求,那麼標準化、自動化、架構最佳化、過程最佳化、等降低IT服務成本的因素越來越被人們所重視。其中,自動化最開始作為代替人工操作為出發點的訴求被廣泛研究和應用。
IT運維從誕生髮展至今,自動化作為其重要屬性之一已經不僅僅只是代替人工操作,更重要的是深層探知和全域性分析,關注的是在當前條件下如何實現效能與服務最最佳化,同時保障投資收益最大化。自動化對IT運維的影響,已經不僅僅是人與裝置之間的關係,已經發展到了面向客戶服務驅動IT運維決策的層面,IT運維團隊的構成,也從各級技術人員佔大多數發展到業務人員甚至使用者佔大多數的局面。
因此,IT運維自動化是一組將靜態的裝置結構轉化為根據IT服務需求動態彈性響應的策略,目的就是實現IT運維的質量,降低成本。可以說自動化一定是IT運維最高層面的重要屬性之一,但不是全部。
存在問題
目前許多企業的IT運維已經實現從人工運維到計算機管理,但在同客戶的交流中發現其中很多企業的IT運維管理還只是處在“半自動化”的運維狀態。因為這種IT運維仍然是等到IT故障出現後再由運維人員採取相應的補救措施。這些傳統式被動、孤立、半自動式的IT運維管理模式經常讓IT部門疲憊不堪,主要表現在以下三個方面:
(1)IT 運維人員被動、效率低
在IT運維過程中,只有當事件已經發生並已造成業務影響時才能發現和著手處理,這種被動“救火”不但使IT運維人員終日忙碌,也使IT運維本身質量很難提高,導致IT部門和業務部門對IT運維的服務滿意度都不高。目前絕大多數的企業IT運維人員日常大部分時間和精力是處理一些簡單重複的問題,而且由於故障預警機制不完善,往往是故障發生後或報警後才會進行處理,使到IT運維人員的工作經常是處於被動“救火”的狀態,不但事倍功半而且常常會出現惡性連鎖反應。
(2)缺乏一套高效的IT運維機制
目前許多企業在IT運維管理過程中缺少自動化的運維管理模式,也沒有明確的角色定義和責任劃分,使到問題出現後很難快速、準確地找到根本原因,無法及時地找到相應的人員進行修復和處理,或者是在問題找到後缺乏流程化的故障處理機制,而在處理問題時不但欠缺規範化的解決方案,也缺乏全面的跟蹤記錄。
(3)缺乏高效的IT運維技術工具
隨著資訊化建設的深入,企業IT系統日趨複雜,林林總總的網路裝置、伺服器、儲存裝置、中介軟體、業務系統等讓IT運維人員難以從容應對,即使加班加點地維護、部署、管理也經常會因裝置出現故障而導致業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分原因是企業缺乏事件監控和診斷工具等IT運維技術工具,因為在沒有高效的技術工具的支援下故障事件很難得到主動、快速處理。
迫在眉睫
儘管IT運維管理的技術在不斷進步,但實際上很多IT運維人員並沒有真正解脫出來,原因在於目前的技術雖然能夠獲取IT裝置、伺服器、網路流量,甚至資料庫的警告資訊,但成千上萬條警告資訊堆積在一起更本沒法判斷問題的根源在哪裡。另外,目前許多企業的更新管理絕大多數工作都是手工操作的。即使一個簡單的系統變更或更新往往都需要運維人員逐一登入每臺裝置進行手工變更,當裝置數量達至成百上千時,其工作量之大可想而知。而這樣的變更和檢查操作在IT運維中往往每天都在進行,佔用了大量的運維資源。因此,實現運維管理工作的自動化對企業來說已迫在眉睫。
現在隨著IT運維管理工作的複雜度和難度的大大增加,僅靠過去幾個“運維英雄”或“技術大拿”來包打天下已經行不通了,企業開始需要運用專業化、標準化和流程化的手段來實現運維工作的自動化管理。因為透過自動化監控系統能及時發現故障隱患,主動的告訴運維人員需要關注的資源,以達到防患於未然。例如,全天候自動檢測與及時報警能實現IT運維的“全天候無人值守”,大大降低IT運維人員的工作負擔。而且,透過自動化診斷能最大限度地減少維修時間,提高服務質量。因此, 對於越來越複雜的IT運維來說,將純粹的人工操作變為一定程度的自動化管理是一個重要發展趨勢。原因有三:
- 首先,IT運維流程自動化能夠提高流程的可控性,可以基於業務需求來制定個性化的流程,使企業領導有機會看見他們的業務流程,對企業流程有一個深刻的分析和理解,進而改造和最佳化流程。
- 其次,IT運維流程的自動化能提高透明度。因為隨著業務需求的變化可能會有多個版本出現,手工流程的不透明將會給流程定製和最佳化帶來相當大的困難,而自動化流程可以使使用者能夠一目瞭然的看到整個流程的各個節點運轉情況,自動化工具潛移默化地提升業務保障能力。
- 再者,運維繫統實行了自動化監控以後,透過工具自動監控對人的工作是一種減負,也是一種降低成本的表現。
工具
對於企業來說,要特別關注兩類自動化工具:一是IT運維監控和診斷最佳化工具;二是運維流程自動化工具。這兩類工具主要應用於:
- 監控自動化,是指對重要的IT裝置實施主動式監控,如路由器、交換機、防火牆,伺服器,儲存和備份裝置等。
- 配置變更檢測自動化,是指IT裝置配置引數一旦發生變化,將觸發變更流程轉給相關技術人員進行確認,透過自動檢測協助IT運維人員發現和維護配置,避免配置錯誤引發的故障。
- 維護事件提醒自動化,是指透過對IT裝置和應用活動的實時監控,當發生異常事件時系統自動啟動報警和響應機制,第一時間通知相關責任人。
- 系統健康檢測自動化,是指定期自動地對IT裝置硬體和應用系統進行健康巡檢。配合IT運維團隊實施對系統的健康檢查和監控。
- 維護報告生成自動化,是指定期自動的對系統做日誌的收集分析,記錄系統執行狀況,並透過階段性的監控、分析和總結,定時提供IT運維的可用性、效能、系統資源利用狀況分析報告。
建立管理步驟
(1)建立自動化運維管理平臺
IT運維自動化管理建設的第一步是要先建立IT運維的自動化監控和管理平臺。透過監控工具實現對使用者操作規範的約束和對IT資源進行實時監控,包括伺服器、資料庫、中介軟體、儲存備份、網路、安全、機房、業務應用和客戶端等內容,透過自動監控管理平臺實現故障或問題綜合處理和集中管理。例如,在自定義週期內進行自動觸發完成對IT運維的例行巡檢,形成檢查報告。包括自動執行維護,以完成對系統補丁的同步分發與升級、資料備份、病毒查殺等工作。
(2)建立故障事件自動觸發流程,提高故障處理效率
所有IT裝置在遇到問題時要會自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維螢幕上。然後IT運維人員只需要按照相關知識庫的資料,一步一步操作就可以。因此,企業需要事先建立自動工單式流程管理,當裝置或軟體發生異常或超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關IT運維人員。IT運維人員必須在指定時間內完成流程所規定的環節與工作,以提高IT運維響應問題的效率。
(3)建立規範的事件跟蹤流程,強化運維執行力度
IT運維自動化管理建設時,首先需要建立故障和事件處理跟蹤流程,利用表格工具等記錄故障及其處理情況,以建立運維日誌,並定期回顧從中辨識和發現問題的線索和根源。事實上許多實踐也證明,建立每種事件的規範化處理和跟蹤指南,可以減少IT運維操作的隨意性和強化運維的執行力度,在很大程度上可降低故障發生的機率。同時,使用者還應可以透過自助服務檯、電話服務檯等隨時追蹤該故障請求的處理狀態。
(4)設立IT運維關鍵流程,引入優先處理原則
設立IT運維關鍵流程,引入優先處理原則是指要求CIO定義出IT運維的每個關鍵流程,不僅僅是定義流程是什麼,還包括要指出每個關鍵流程對企業有什麼影響和意義。同時,在設定自動化流程時還需要引入優先處理原則,例行的事按常規處理,特別事件要按優先順序次序處理,也就是把事件細分為例行事件和例外關鍵事件。
介紹
永服科技有限公司(簡稱“ServiceHot”或“永服科技”),是中國優秀的 IT服務管理解決方案服務商和產品廠商,註冊資金5000萬,總部坐落於江蘇無錫,在北京、上海、廣州、成都等多地設立了分支機構。
ServiceHot 擁有優秀的ITSM產品和多年IT服務管理專案的實施經驗,運用ITIL、ISO20000等最佳實踐方法,為客戶提供ITIL諮詢服務、ITSM產品、定製化開發服務、落地實施服務、ITIL/ITSS認證,為企業資訊化建設,安全、可靠、高效地執行提供有力的保障。三大核心產品分別是ServiceHot ITSM(IT服務管理平臺)、ServiceHot ITSOM(IT服務運營管理平臺)和ServiceHot SOM(服務運營管理)。產品基於J2EE搭建的架構平臺、可以適應雲端計算部署環境,具有較好的易用性、擴充套件性以及配置功能,適用於企業目前IT服務過程不斷改進、提升,業務邏輯及流程複雜等環境的要求,產品在大型的國企、製造業、金融等多行業完成了實際的應用和推廣。
ServiceHot 是中國電子工業標準化ITSS副組長單位,參與國家IT服務標準的編制和評審。榮獲2018 “中國IT服務十大優秀產品”(ITSM類)、2017-2018年度中國SAAS產業最佳IT服務類SAAS服務商。案例包括:山東省農信、國信證券、鄭州商品交易所、深圳證券資訊、長虹集團、中航西飛、一汽啟明、中國移動、雲天化集團、天原集團、華為、蘋果等。
ServiceHot 一直秉承“讓您掌控IT運營服務的每一個瞬間”理念,以客戶為中心技術為驅動,持續專研從ITSM到ITSOM再到SOM的升級和創新方案,讓企業級IT服務管理擁有“智慧、協同、移動、社交”的體驗。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31470963/viewspace-2707159/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- IT運維之自動化運維運維
- Ansible自動化運維工具運維
- 自動化運維的快速演進運維
- 什麼是自動化運維?為什麼選擇Python做自動化運維?運維Python
- 指標是構築自動化運維與智慧化運維的基石指標運維
- ansible自動化運維入門運維
- 簡化IT運維工作,就要學會使用自動化運維工具!運維
- 自動化運維工具ansible的實踐運維
- 分層運維自動化監控運維
- 自動化運維工具Ansible介紹運維
- ansible自動化運維資料庫運維資料庫
- 網路工程師眼中的自動化運維工程師運維
- 自動化運維平臺的流程草圖運維
- Linux Shell互動式自動化運維程式Linux運維
- 阿里雲釋出ECS自動化運維套件,幫助企業實現自動化運維轉型阿里運維套件
- 運維自動化之賬單系統運維
- Python+Django+Ansible Playbook自動化運維PythonDjango運維
- Oracle 自動化運維-Python連線OracleOracle運維Python
- Python自動化運維之IPy模組Python運維
- 自動化運維工具之Puppet模組運維
- 自動化運維工具——ansible詳解(一)運維
- 自動化運維工具——ansible詳解(二)運維
- 自動化運維和普通的運維的區別是什麼?哪個好?運維
- 自動化運維的發展趨勢介紹!運維
- 自動化運維平臺的實施計劃運維
- IT運維和自動化運維以及運維開發有啥不同?能解釋下嗎?運維
- 自動化運維,國產化信創替代方案運維
- 透過運維編排實現自動化智慧運維與故障自愈運維
- [Linux]Ansible自動化運維② - 工具與模組Linux運維
- 自動化運維利器Ansible要點彙總運維
- [Linux]Ansible自動化運維① - 入門知識Linux運維
- Telegraf+Influxdb+Grafana自動化運維監控UXGrafana運維
- 運維效率之資料遷移自動化運維
- 雷神 Thor —— TiDB 自動化運維平臺TiDB運維
- 【運維自動化】37秒萬臺伺服器標準化與交付自動化運維伺服器
- 運維工作新時代:自主編碼實現運維自動化的轉型之旅運維
- 運維轉型之路 —手工運維到無人值守的自動化運維,從根本實現降本增效運維
- 簡單介紹python自動化運維常用庫Python運維