IT運維之自動化運維

pigoss03發表於2021-03-30

所謂自動化運維,即在最少的人工干預下,結合運用指令碼與第三方工具,保證業務系統7*24小時高效穩定執行。這應該是所有業務系統運維終極目標。

按照運維的發展成熟度來看,運維大致可分為三個階段:

  • 依靠純手工,重複的進行軟體的部署與運維;
  • 透過編寫指令碼,方便的進行軟體的部署與運維;
  • 藉助第三方工具,高效的進行軟體的部署與運維;

我們對運維的要求通常是:

1 、事前預警

         對各業務系統和底層的軟硬體進行監控,以保證業務系統的正常執行。做到事前預警,避免故障來臨,後知後覺。

   

2 、事中解決

   天有不測風雲,即使是再完美的方案也可能有預料之外的故障,為保證在最短時間內恢復業務,系統必須能快速定位故障點。並進行告警分派並解決

 

( 三)、事後閉環

   這裡更加強調運維管理的流程方法,針對已產生的告警進行告警分派,解決。形成告警的閉環管理。

 

要實現以上要求,需要一個經驗豐富且高效的運維團隊,隨著我們的業務系統不斷增加,業務量的不斷上升,傳統依靠純手工的運維方式,逐漸被淘汰。

我們更多的將注意力集中在透過指令碼與藉助第三方工具的運維方式上,這樣不僅能滿足我們對運維的要求,解放生產力,還能使我們的運維管理更加規範化,標準化,從而真正意義上的實現自動化運維。

自動化運維的實現工具(指令碼與第三方工具,通常這兩者須結合使用。)

 

指令碼(SHELL、DOC)

1 、硬體狀態監控:透過編寫指令碼,對CPU、MEM、DISK、TOPProcesses、Network等關鍵硬體引數狀態進行實時監控,發現異常觸發告警資訊給管理員;

2 、業務撥測:透過編寫指令碼對常用業務的網站實時進行撥測,發現網站頁面異常觸發告警資訊給管理員;

3 、系統安全加固:透過編寫指令碼對常用的Windows、Linux、Unix伺服器進行快速的安全加固;

4 、資料備份:透過編寫指令碼實現關鍵業務資料,關鍵日誌,資料庫,作業系統,中介軟體等的快速備份(本地與異地);

 

第三方管理工具(運維監控系統--PIGOSS BSM )

 

針對一些比較重要的業務系統,我們建議可以使用比較成熟的第三方運維監控工具。運維監控工具一般都能實現以上運維需求,而且管理操作起來也更加方便。

 

伺服器監控

 

PIGOSS  BSM可透過帶外、帶內方式對PC伺服器、小機及刀箱底層硬體狀態進行全面的監控,包括處理器、記憶體、硬碟、電源、風扇、溫度、插槽等硬體狀態和配置資訊,代替管理員的日常機房巡檢工作,使管理員實時瞭解到伺服器底層硬體的執行情況

 

Oracle 、虛擬化、AIX等專業的應用監控

 

PIGOSS BSM 對於Oracle的監控是汲取了專業的Oracle DBA的一線經驗,把實際應用場景對於Oracle的關注資訊沉澱到產品中,其中SQL-TOP排序、ORA錯誤日誌等功能得到使用者的極大認可,透過一體化檢視呈現Oracle的整體執行狀態。

虛擬化監控透過圖形化方式構建出宿主機、虛擬機器、虛擬網路、資料儲存間資源使用情況,從全域性到區域性的一體化檢視,便於使用者直觀全面瞭解當前虛擬化環境的健康狀況。

 

業務大屏

 

PIGOSS BSM 的業務大屏對各類業務系統,從基礎網路、系統服務、中介軟體、資料庫和儲存裝置多個層級進行全方位監控,為運維管理人員提供全域性的業務健康度一覽。業務雷達圖及狀態矩陣實時掃描各業務系統的最新告警及業務健康度,產出故障可直接追溯到最底層的告警源裝置,便於運維工程師快速找到故障點。


第三方的運維工具是運維工作中不可或缺的一部分,如何構建適合自己的運維工具,每家的需求不一樣,每個運維面對的痛點也不盡相同,但不管有什麼需求,多少需求,萬變不離其宗。運維監控的路上,我們一起前行。

 

 

解決方案

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31351613/viewspace-2765766/,如需轉載,請註明出處,否則將追究法律責任。

相關文章