陝重汽:大規模資料庫如何實現自動化運維?
導讀:陝重汽目前亟需建設具有豐富功能的資料庫自動化運維平臺,實現資料庫日常運維管理的標準化、自動化和智慧化。美創科技利用 資料庫執行安全管理平臺(OSM)+運維雲線上與線下結合的綜合解決方案,高效率地完成故障提前感知,問題智慧定位以及故障智慧解決等,實現大規模資料庫自動化運維。
陝西重型汽車有限公司(以下簡稱“陝重汽”)成立於2002年,現有資產總額373億元,從業人員1.6萬人,科研力量雄厚,是重型商用車領域全球知名企業,已在阿爾及利亞、肯亞、馬來西亞等國家實施了本地化生產,產品銷往世界100多個國家和地區,出口量連續多年位居行業前茅。
近年來,陝重汽業務規模不斷髮展,IT系統也隨著業務擴充持續建設,作為企業數字資產“核心”的資料庫,其數量和資料量也迅猛增長。資料庫總數已近百套,其中核心繫統20餘套,包括ERP、BOM、MES、SCM、PLM、VPM、DMS、海外DMS、WMS等。
對於一家擁有眾多業務系統、海量資料的企業而言,業務系統執行的穩定不容有一絲的閃失。但傳統的運維方式在資產管理、批次部署、自動巡檢方面無有效手段,不能對大規模資料庫進行實時監控,此背景下,陝重汽目前亟需建設具有豐富功能的資料庫自動化運維平臺,實現大規模資料庫日常運維管理的標準化、自動化和智慧化。
01 需求背景
1)資產統一化管理
陝重汽資料庫總數近百套,需要對資料庫資產及資源進行統一管理。將日常資料庫監控管理納入標準化,智慧化管理階段,便於隱患早發現早處理,為資產管理工作提供便利。
2)自動化部署
需要一種自動化安裝部署資料庫的手段,實現可快速響應系統開發、測試、生產階段對資料庫環境的需求,縮短資料庫部署的時間。
3)執行狀態監控
需從資料庫的併發數、CPU使用率、記憶體使用量、IO延遲時間、網路延遲時間等維度,全面地分析資料庫各資源使用情況,讓運維人員可以提前感知執行風險,快速定位問題。
4)標準化自動巡檢
需要對統一資料庫的健康狀態進行自動化巡檢,獲取資料庫、主機在巡檢時間段內所有指標的狀態資訊,以便快速瞭解大規模資料庫的一個整體執行狀況和健康狀態,提升巡檢工作效率。
02 解決方案
針對陝重汽對於大規模資料庫執行維護的需求,美創科技利用
資料庫執行安全管理平臺(OSM)+運維雲線上與線下結合的綜合解決方案,高效率高安全地完成故障提前感知,問題智慧定位以及故障智慧解決,同時透過豐富的場景化運維工具,實現資料庫的高效、智慧運維,全面保障資料庫的執行安全。
該方案將日常資料庫監控管理納入標準化,提高整體資料庫高可用性;實現自動化的資料庫安裝部署快速交付,實現資料庫自動化監控及深度健康巡檢。理補齊“雲化管理、運維前置、智慧巡檢、智慧監控、資產管理、自動部署”等方面短板。
實現資料庫的資源統一管理包括:資料庫資產管理、資料庫執行監控、智慧巡檢、日常運維管理、資料安全管理、資料庫自動部署等功能;減少資料庫維護人員的日常運維工作,簡化故障處理的流程和複雜度,讓資料庫運維人員減少被動性救火工作,將資料庫運維標準化、流程化、體系化。
美創科技部署圖
1)資料庫聚合監控
透過資料庫執行安全管理平臺的資料庫監控功能,實現對資料庫資產的的聚合監控及單一精細化監控,確保業務系統的連續穩定可用。
資料庫執行安全管理平臺
2)資料庫全面巡檢
透過全面巡檢工具,全面、深度分析主機和資料庫執行狀態,有效定位系統隱患和資源瓶頸,一鍵操作即可完成資料庫的全面而深度的檢查工作。
從資料庫的可用性、資料庫資源、資料庫安全、物理備份、主機資源資料庫效能、資料庫引數以及資料庫軟體等八個維度實現資料庫的巡檢分析工作,保證資料庫檢查的全面、深度和準確性。同時提供線上和匯出PDF、word文件等多種方式檢視巡檢報告。利用巡檢報告,運維人員可以全面直觀地掌握資料庫的執行狀況的異常以及相關效能好壞。
3)資料庫效能分析
透過資料庫執行安全管理平臺提供的效能分析工具從資料庫的併發數、CPU使用率、記憶體使用量、IO延遲時間、網路延遲時間5個維度,全面地分析資料庫各資源使用情況,並給出資料庫效能是否正常結論,讓運維人員以最快時間瞭解到自己關注的資料庫物件效能是否良好。
4)資料庫資產管理
透過資料庫執行安全管理平臺提供的資產分析工具,自動分析統計平臺內所有資料庫的不同版本、單機、叢集等的數量,並以圖形化展示,讓運維人員直觀快速地掌握資料庫資產的分類統計,為資產管理工作提供便利。
資料庫資產管理
方案亮點:
1、美創科技
資料庫執行安全管理平臺(OSM)+運維雲線上線下結合的綜合解決方案實現了對資料庫執行狀態的安全管理,融合AI技術和大資料模型,智慧監控、預測和趨勢分析,功能覆蓋資料庫日常運維場景。
2、實時監控資料庫執行狀態,提前感知執行風險,智慧定位問題,並利用工具箱快速解決故障,實現運維閉環。
03 客戶收益
➢ 資料庫資產自動發現、統一管理:
陝重汽透過資料庫執行安全管理平臺的建立,實現了對資料庫資產的自動發現統一管理;
➢ 自動化運維,提升運維人員工作效率:
透過資料庫執行安全管理平臺的建立,極大的提高了陝重汽一線資料庫運維人員的運維效率,資料庫交付由之前的1-2個工作日提高到現在的30分鐘,實現了對整個資料庫伺服器軟硬體的“集中管理、統一運維”,提高了運維效率,保障了業務系統安全穩定執行,實現了資料庫統一全生命週期管理;
➢
提升系統健壯性:
透過資料庫執行安全管理平臺的建立,實現了標準化的安裝交付,規避資料庫安裝部署階段不規範及引數配置問題而引起上線後的執行風險,增加系統健壯性;
➢
視覺化大屏監控:
透過美創資料庫執行安全管理平臺聚合全景大屏和單個資產聚焦大屏,對所有資料庫物件實現聚合監控和單一物件的詳細監控,直觀清晰地瞭解到各資料庫物件及其對應的業務系統整體執行情況。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69973247/viewspace-2757538/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- vivo大規模Kubernetes叢集自動化運維實踐運維
- vivo大規模 Kubernetes 叢集自動化運維實踐運維
- ansible自動化運維資料庫運維資料庫
- 深度 | 螞蟻金服自動化運維大規模 Kubernetes 叢集的實踐之路運維
- 如何落地資料庫智慧化運維?資料庫運維
- 資料庫運維管理規範資料庫運維
- Python自動化運維之IPy模組Python運維
- 自動化運維工具之Puppet模組運維
- 運維效率之資料遷移自動化運維
- IT運維之自動化運維運維
- 如何透過資料開發治理實現資料流程的自動化和規範化?
- 阿里雲釋出ECS自動化運維套件,幫助企業實現自動化運維轉型阿里運維套件
- 透過運維編排實現自動化智慧運維與故障自愈運維
- 自動化運維專案前期規劃五大難點運維
- 是否只有實現了容器化、自動編排等等才算是實現了運維自動化?運維
- [Linux]Ansible自動化運維② - 工具與模組Linux運維
- Python自動化運維之psutil系統效能資訊模組Python運維
- Devops-運維效率之資料遷移自動化dev運維
- 如何運維多叢集資料庫?58 同城 NebulaGraph Database 運維實踐運維資料庫Database
- 自動化運維工具ansible的實踐運維
- 資料庫運維 | 攜程分散式圖資料庫NebulaGraph運維治理實踐資料庫運維分散式
- 運維工作新時代:自主編碼實現運維自動化的轉型之旅運維
- 簡單介紹python自動化運維常用庫Python運維
- 乾貨滿滿 | 美團資料庫運維自動化系統構建之路資料庫運維
- Ansible自動化運維工具運維
- 透過自動化運維實現無人值守的故障自愈運維
- 運維轉型之路 —手工運維到無人值守的自動化運維,從根本實現降本增效運維
- 資料庫 三大正規化資料庫
- 資料庫三大正規化資料庫
- 新基建 破局大規模資料中心智慧化監控運維管理運維
- 直擊DTCC2019現場:資料庫智慧化運維探索與實踐資料庫運維
- 從零開始實現資料庫自動化巡檢(一)資料庫
- 在Rainbond中實現資料庫結構自動化升級AI資料庫
- 騰訊雲ClickHouse如何實現自動化的資料均衡?
- 什麼是自動化運維?為什麼選擇Python做自動化運維?運維Python
- IDC企業如何實現智慧化運維運維
- IT 自動化:如何去實現
- 運營商大規模資料叢集治理的實踐指南