G行全棧雲運營實踐

大雄45發表於2022-03-06
導讀 全棧雲作為G行123+N數字化銀行發展體系中基礎技術平臺的雲端計算平臺,目前已正式投產執行,標誌著建雲任務已初步完成,但云的建成只是起點,用好雲才是難點,建立成熟的方法論、平臺工具和人力支撐,將是接下來發揮雲效能、為企業創造價值的關鍵。
運維與運營的區別

準確來講,運維和運營沒有明確的分界線,是不同的能力階段。簡而言之,運維是為了保證產品能夠高效穩定地服務使用者,運營則是為了幫助使用者更好地使用產品,並輔助運營主體發現使用者需求、改進產品能力。全棧雲場景下,兩者的差異主要體現在服務目標、服務物件、服務內容等三方面。

1. 服務目標方面。運維的主要目標是保障全棧雲穩定執行,能夠持續交付使用者所需的雲資源;運營的主要目標是向使用者提供其所需的服務,並保證使用者獲得服務的滿意度,同時維持合理的服務成本,使應用上雲產生真正的價值。

2. 服務物件方面。運維活動側重於全棧雲的軟硬體層面,服務物件主要包括網路、儲存、伺服器、安全裝置等基礎設施及平臺軟體;運營活動則偏重雲服務及平臺使用者層面,服務物件主要指平臺使用者及服務SLA。

3. 服務內容方面。運維活動內容主要包括平臺軟硬體的故障處理、配置方案設計和配置變更等;運營活動內容主要包括平臺演進和容量管理、應用上雲支撐、雲上應用的執行保障等。

G行全棧雲運營實踐G行全棧雲運營實踐

全棧雲運營體系的構建思路
2.1 概述

運營管理活動包括運營目標、運營方針、運營模式、運營體系等四個層次。運營目標是組織運轉的中長期目標,建立在其責任與定位基礎上。運營方針是為達成運營目標而提出的在一定時期內的總體性指導意見,是實現運營目標的主要途徑和重點方向。運營模式是運營的總體方式方法,說明了在運營方針的指導下運營要素的定義及運營要素之間關係。運營體系則是運營目標、運營方針、運營模式等抽象理論指導在企業內的具體實踐落地。

G行全棧雲運營實踐G行全棧雲運營實踐

總而言之,運營目標和運營方針用於指導運營模式的建立,運營模式用於指導運營體系的規劃,運營體系則用於支撐運營模式的維持和運轉。

2.2 運營目標

雲的運營目標通常包括以下幾方面內容:

1. 為企業應用提供滿足其執行要求的服務,即設計、開發、建設、交付貼近企業應用執行要求服務,並儘可能實現能力共享。

2. 實現友好的服務交付過程,即制定合理的服務申請、稽核和交付過程,能夠按時、按質、按量交付應用執行所需要的服務。

3. 裝置資源的有效利用,即在充分滿足應用執行需求的基礎上降低裝置和平臺的採購、建設、維護成本。

現階段G行全棧雲的運營目標是實現資源的精細化管理和敏捷交付,支撐金融科技創新。

2.3 運營方針

雲的運營方針在運營的不同階段,應根據企業戰略和使用者需求的轉變而調整。建設初期的工作重點在於提升服務交付能力,建設中期的工作重點在於提升產品質量和產品豐富程度,建設後期的工作重點則在於提升客戶滿意度。運營方針的改變影響到組織的力量投入與政策傾斜,可能會造成運營模式的調整。

全棧雲現階段運營方針為立足企業級服務視角,以使用者為中心,業務需求為導向,通過快速迭代完善全棧雲運營體系建設,實現面向公司各級業務主體的價值創造,助力運營目標的實現。

全棧雲執行體系的設計實踐
3.1 運營框架

關於雲的運營,業內暫無通用解決方案,大多仍參考華為、阿里等商業化雲服務提供商的運營模式體系。G行主要參考了華為雲的運營模式,結合全棧雲運營現狀和差距分析,以典型場景和需求為載體,構建了“兩大運營內容、四大支撐體系”的運營體系框架,旨在實現IT資源、能力服務的“企業級”共享。其中,兩大運營內容包含平臺運營、應用運營,四大支撐體系包括組織體系、流程體系、工具體系、評價體系。

G行全棧雲運營實踐G行全棧雲運營實踐

3.2 運營內容

3.2.1 平臺運營
以全棧雲的穩定執行為基礎,面向客戶業務需求,適配不同的服務和技術要求,保障業務應用的可靠執行,同時兼顧平臺自身的優化和擴充套件。從自身的服務要求出發,可以拆分為租戶精細運營、視覺化運營、自動化運維三大專題:

1)租戶精細化運營:通過多級租戶分權分域管理、租戶計量機制、雲服務產品目錄管理、以及各級租戶的容量管理達到租戶按組織層級管理的便捷性。

2)視覺化運營:通過資料中心展示、租戶資源展示、應用效能展示瞭解硬體資源和雲資源狀態情況,監控各級租戶資源分配及使用情形,掌握應用資源、元件、KPI、應用拓撲等效能趨勢。

3)自動化運維:通過執行保障、故障智慧診斷、維護操作自動化構建全棧雲場景下自動化運維能力,實現運維流程的集中化、標準化、規範化,故障診斷的場景化和智慧化,有效降低因重複操作帶來的工作壓力,降低操作風險,提高運維質量,提升運維效率和滿意度。

3.2.2 應用運營
面向使用者的業務需求,提供具有針對性的定製化運營服務,解決使用者在應用上雲過程中的問題,指導使用者快速上雲。應用運營根據上雲過程行為分成業務快速上雲、應用開發支援、資源按需供給專題:

1)業務快速上雲:通過建立一套完整的上雲評估機制,針對應用類系統上雲可行性和風險進行分析,結合應用類系統需求從部署模型、資源交付、高可用架構等方面制定上雲方案,並設計相應的雲服務,構建開放共享的雲服務清單,保證業務上雲的便捷高效。

2)資源按需供給:對租戶專案的雲資源配額進行審批、登記、部署、發放和狀態跟蹤,通過制定資源發放和回收策略,合理發放雲資源並週期性重檢回收閒置的雲資源,降低業務系統穩定執行成本,確保資源合理分配和使用。

3.3 支撐體系

人員組織體系:遵循組織協同一體化、職責定義清晰化、活動處理流程化、團隊建設梯隊化、個人能力縱深化等原則,建議設立以下班組或團隊:調控組、執行組、產品組、客服組、交付組、專家組。

流程規範體系:為有效開展全棧雲運營工作,實現服務能力和服務質量的持續提升,服務成本的持續優化,適應從運維向運營的轉型,需重新規劃流程和規範,為運營服務提供流程體系保障。

工具平臺體系:按照標準化、模板化、工具化、自動化、智慧化的持續演進原則,將運營過程中的各類技術和流程呼叫封裝成成熟、可靠、易用的工具產品,降低人員技能要求,降低人力成本,降低手工操作風險。圍繞應用上雲和故障診斷,主要打造上雲資源申請模板工具、資源交付監控工具、上雲遷移工具、呼叫鏈分析工具等支撐工具。

價值評價體系:從質量、進度、成本等維度,構建以“服務連續性指標”、“客戶服務指標”、“資源與能力建設指標”為核心的服務評價體系,搭建與運營體系相適應的能力模型和考核指標,通過對服務質量的分析,衡量內部團隊運作效率和外部運營效果,明確流程設計是否科學、上雲服務是否及時等,激發運營人員的積極性和創造性,推動運營體系的改進和優化。

總結

所謂“三分建設、七分運營”,雲的建成只是起點,雲的運營才是後續的重點。G行在設計全棧雲運營體系時,充分分析了全棧雲運營所面臨的問題與挑戰,並結合現有的安全運營體系,按照“服務方式從被動向主動轉變,思維方式從成本導向向價值導向轉變”的工作思路,從運營目標、運營方針、運營模式、運營體系等四個層次完成了整體運營設計。希望以上內容也能夠為同業提供參考,同時G行也希望與同業開展深入交流,共同打造面向整個行業的運營解決方案。

原文來自:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69955379/viewspace-2855478/,如需轉載,請註明出處,否則將追究法律責任。

相關文章