電力電網行業IT運維方案

北京智和信通發表於2023-04-24
智慧電網背景下,電力、電網企業資訊化逐漸滲透到其業務鏈的各個環節,雲端計算、物聯網、移動網際網路等新技術的應用,更驅動資訊化與業務創新深度融合。電力、電網企業集團資訊系統群逐漸朝著一體化方向發展,資訊鏈越來越長,問題追蹤越來越複雜,舊有的分散IT運維組織無法承擔新的運維工作,這就要求必須改變IT運維組織以滿足新的整合需求,分散或半集中的運維模式不可避免要向集中運維模式發展。

電力電網IT運維建設背景

相對於傳統行業,我國電力行業的資訊化建設發展較早,已經有了一定的規模,到目前為止,電力企業的網路普遍建立,電力專用通訊網已日趨完善,形成了微波、衛星、光纖、無線行動通訊等多種通訊手段,通訊範圍覆蓋全國。在此基礎上,基本建成從國家電網公司→區域電網中心→省電力公司→地市電力公司→變電所(局)的四級計算機網路和電力生產排程網路,成為生產控制、電力排程以及資訊傳輸和交換的重要基礎設施。

同時,隨著電力市場化和電網建設的進一步發展,傳統電力系統業務正在發生變化。電力交易系統、電能量計量系統建設加速;會議電視、變電站影片監控(無人值守)、輸變電線路監控及電廠影片監控等影片業務出現;傳統單一主機的排程自動化體系架構向客戶機/伺服器體系架構轉變;雷電定位系統、氣象資訊系統等建設;多媒體業務出現等方面。

隨之而來的是因電力網網路系統、業務分佈在不同的地區,同時又分佈在各個地區的不同位置,日常的網路維護和操作的工作量大大增加,網路系統和電力業務需要一個可靠,便捷、功能強大的網路運維監控系統來充分有效地管理和利用區域網路資源。

電力電網運維痛點

智慧電網的建設背景給IT基礎設施的建設和運維管理提出了更高要求。從網路、儲存到應用系統都要求具備更高的可用性、可擴充套件性、穩定性和安全性,為業務系統的高效能執行提供更加強大的支撐。圍繞IT基礎設施開展的運維活動,則要求更快速、規範,更主動有效。
隨著“SG186工程”全面實施,電網企業逐步建立兩級三線四層運維模式,資料中心和應用系統等全面向總公司和省網公司集中,大量運維工作在這兩級完成。由於整體IT系統發展速度快、變化頻繁,各級運維面臨諸多難題,壓力激增。
  • 根據電監會5號令要求電網企業的電力系統安全防護工作應當堅持安全分割槽、網路專用、橫向隔離、縱向認證的原則,所以需要一套平臺能夠完善地將IT設施集中統一運維監控起來。
  • 需管理的IT裝置型別多、廠商多,資料中心機房內環境監控裝置種類多,難實現資源的統一管理,運維人員無法實時掌握各系統裝置執行情況。
  • 無法實時監控雲平臺CPU、記憶體、磁碟I0、網路流速、儲存容量等核心指標,缺乏雲平臺資源消耗統計手段,無法科學合理地分配資源。
  • 發現故障後知後覺,難以定位故障根因,跨部門溝通艱難且效率低,故障排除靠經驗,疲於應對各類運維事件,缺乏自動化手段及工具。
  • 因業務管理及監管的需要,省公司需要對下屬單位區域網路進行直接、實時的跨地域監管的同時,各下屬單位也需實現對內部網路的獨立分級管理。
  • 受限於各系統分隔和物理地域隔離,無法實現業務資訊的互動和貫通,不能精準確定各類異常事件對業務造成的影響程度及範圍,難以從多個視角直觀掌握業務執行態勢。
  • 電力電網體系內監控系統複雜多樣,相互隔離,缺乏資料統一採集,缺乏資源統一納管,多數網省公司存在大量未接入的系統和裝置,制約執行監視深化應用。

智和信通電力電網多級網路集中運維方案

智和信通根據電力電網的運維需求,打造統一的IT運維監控平臺,實現統一、集中、全面、分層次的IT運維管理。
電力電網行業IT運維方案


分散式部署分級監測網路

電力、電網行業IT架構規模龐大、業務系統眾多,特別是資料中心應用逐漸複雜,給網路運維帶來了很大的挑戰。智和信通採取分散式部署的方案,分級、分割槽域監測整體網路。
在多級運維平臺部署方案中,採用綜合-區域-裝置運維平臺-裝置的結構,部署多級架構運維平臺方案,上級運維平臺可以檢視下級運維平臺(包含其子集)的監控資訊,綜合運維平臺可以管理所有裝置,下級運維平臺對本區域內單位或本單位網路進行管理。
電力電網行業IT運維方案
多級平臺部署示意圖

IT架構智慧視覺化顯示

隨著資料中心和應用系統等全面向總公司和省網公司集中,在運維管理上,採取智慧技術,實現網路拓撲視覺化的能力,透過動態智慧拓撲實現全網裝置、資源、連結關係、IP等實時更新、快速定位。
電力電網行業IT運維方案

電力電網企業拓撲示意圖


透過按片區、按地域、按層級等多種佈局方式劃分網路,使用不同顏色、粗細、圖示表示被管理物件的狀態資訊,助力運維人員實時瞭解網路架構及全網執行狀態,快速感知資源、鏈路、流量等異常資訊。
電力電網行業IT運維方案

電力電網企業拓撲示意圖


透過分級、分權管理,不同人員對不同網路和介面具備差異化許可權。一線二線人員,可直觀看到所在區域的核心拓撲及裝置狀態,管理人員可檢視整體網路狀態,掌控全域性。

全網資源統一監控

本方案實現網路裝置資訊高頻採集,透過對電力網路中海量網路裝置、伺服器、資料庫、應用系統、中介軟體、虛擬化、雲、儲存等裝置的智慧解析和關聯分析,結合全流量採集分析能力,形成整個網路通訊鏈路的多端網路流量分析鏈,助力運維人員從多個維度實現對相應告警的智慧分析,解決傳統運維監控中關聯資料缺失,輔助排障資訊不足的問題。
電力電網行業IT運維方案
裝置資源視覺化顯示

全網MAC-IP管控

北京智和信通自動化運維方案支援端到端規劃、部署、管理和監控IP 地址。透過埠檢視及列表檢視的形式,展示當前IP地址的使用情況,可檢視某個子網的IP現網詳情資訊。
電力電網行業IT運維方案

透過黑白名單配置,透過黑白名單功能用來檢測使用者所關心的裝置是否在網路中出現及出現時間,對非法接入裝置進行告警處置。支援IP-MAC繫結,對全網MAC和IP進行配對繫結,並週期性對MAC-IP進行檢測,當IP-MAC的繫結關係發生衝突時產生告警,保證入網終端安全可信。

全網頻寬、流量回溯分析

方案基於海量流量資料的儲存挖掘,實現對網路流量的偵測分析。透過網路流量分析技術,採集、分析、儲存所有網路流量,回溯分析資料包特徵、異常網路行為,以多維資料分析和深度挖掘為手段,實現資料包層面的流量追蹤,發現潛伏於網路中的未知攻擊。

電力電網行業IT運維方案



針對電力網路中業務專線、物聯網專線等專線線路管理需求,透過實時監控和定期對專線線路的使用情況進行統計分析,為每條專線的擴容或縮容提供資料依據。

精細化私有云監控

方案基於對私有云中的系統資源、租戶資源的監控,實現雲資源的生命週期管理,透過視覺化運維編排,進行雲管理策略預設配置、雲策略批次/定時執行、智慧監控巡檢。支援多雲納管、持續監控,對雲的容量進行智慧化分析,為容量最佳化提供依據。

電力電網行業IT運維方案



靈活可配的實時告警策略

北京智和信通電力電網運維方案,透過統一的故障管理平臺,將各個網路、功能模組中的監控資訊統一採集、分析,實現整個電力網路中各種事件資訊、裝置故障、網路異常、流量異常等告警,以智慧化手段進行標準化的分析、壓縮、並歸關聯等,透過多種方式實時傳達告警資訊,保證落實到指定人員進行處理,為電力電網企業提供主動式的故障解決方案。

電力電網行業IT運維方案



裝置、策略模型無限擴充套件

方案採取使用者自定義裝置型別及其裝置資源的方式,賦予使用者自定義適配裝置的能力,最大可能地支援對不同裝置型別的支援。透過自定義裝置型別及其裝置資源,最大限度上提高了智和網管平臺的管理範圍,真正實現了對裝置及其資源的全面化管理,達到管控萬物的目標。

電力電網行業IT運維方案



全面適配國產信創環境

智和信通國產信創能力採用Java、HTML5跨平臺技術,全面相容國產化作業系統、資料庫、中介軟體、CPU和虛擬化等,支援包括:中標麒麟、銀河麒麟、中科方德、達夢、人大金倉、南大通用、神州通用、華為虛擬化、H3C虛擬化、深信服虛擬化等。

電力電網行業IT運維方案



業務可用性撥測分析

本方案以保障業務可用性為基礎,透過對承載業務的IT基礎設施構建真實的業務模型。直觀呈現面向服務的業務系統體系架構,如財務系統、電力生產管理系統、電力營銷、CRM,ERP、電子商務等業務的邏輯模型。

電力電網行業IT運維方案


業務看板示意圖


透過影響傳遞,準確反映裝置異常對核心業務、使用者造成的影響和威脅,並對造成業務影響的故障進行實時告警,快速查明導致業務中斷的故障源,幫助運維人員做出及時響應,保障業務連續性。

全量業務呼叫鏈追蹤

方案實現完整全鏈路呼叫鏈追蹤,包含詳細的呼叫鏈訪問路徑和效能等訪問資訊,以及相關的各類請求引數等業務資料指標,為故障定位、根因分析提供詳盡的參考資料。
電力電網行業IT運維方案
業務拓撲示意圖

業務依賴關係可視展示

方案透過構建包含各業務整體流程的呼叫依賴關係圖譜,展示業務部署中網路裝置間多維度關係拓撲,透過視覺化的方式呈現業務健康狀況,聯動裝置監控,快速定位導致業務健康指數波動的原因,保障核心業務流程穩定、高效。

業務瓶頸根因定位

方案透過全面的業務資料視覺化能力,既可集中呈現業務資料的使用者體驗狀態,也可以基於應用、裝置實時監控、呈現業務各節點的實時執行狀態,快速定位業務瓶頸根因,並可根據使用者自愈策略,觸發自動運維實現故障自愈。

電力電網行業IT運維方案



跨地域自動巡檢

傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規範、標準,導致巡檢的範圍和深度都存在一定的侷限性,並且是基於人工的手工統計,工作效率比較低,同時耗費較大的人力資源。本方案依託平臺將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略,日常例行巡檢、節假日和重要事件前的巡檢均可自動化執行。

電力電網行業IT運維方案



網路策略遠端配置

電力網路對運維的顆粒度和精細程度均有較高要求,運維過程中網路人員將面對每日數以百計的網路變更及調整,相關的變更從使用者域訪問控制到變更投產,都需要投入大量的人力進行變更內容的評審和準備。在安全合規的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現網路變更、裝置配置自動化。

電力電網行業IT運維方案



裝置策略備份對比

方案支援透過遠端人工、託管的方式進行變更系統配置,修改配置檔案、引數檔案等操作,透過配置檔案批次備份、下載、週期性備份、檢視、對比分析等能力,為使用者管理網路做出合理的建議提供資料支撐。

電力電網行業IT運維方案



全場景自動化運維

從日常的巡檢、災備、應用釋出、變更以及各單位反饋的修復工作等待彙報總結,工程師們親力親為的過程中難免因為疲倦、遺漏或是放寬質量的標準。因此,隨著整個工作體系不斷擴充,傳統的運維方式會漸漸擴大風險、邊際成本。
方案透過智和網管平臺將運維中涉及的服務、命令、操作、執行元件化、策略化,將需要進行的運維服務、操作等以元件、策略的形式託管至平臺中進行維護和管理,實現圍繞各運維場景的自動化,包含:軟體程式碼自動化更新、自動化編譯、自動化打包、自動化釋出、服務自動化升級、軟體自動化部署、故障自愈、定時服務重啟、定期裝置健康狀況自檢、主備資料庫執行狀況自檢異常自動切換、虛擬化/雲服務資源自動化擴容、自動化定期資料清洗、自動化定期環境檢查等。

運維大資料分析

利用圖形、圖表、圖表等易於理解的形式,提取和分析大量複雜的電力網路中各類運維資料,呈現分析結果,從而幫助運維人員在短時間內更好地理解和獲得更多的資訊,幫助運維部門能夠實時瞭解業務和其所依賴IT資源的執行狀況,以及提供系統運維和最佳化的指示和依據。

電力電網行業IT運維方案


適配各種應用場景,二十四小時不間斷監控,細粒度可達網路中每個裝置、資源和鏈路。所有的網路故障都一目瞭然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網路提供了可靠的保證。

IT資產生命週期監管

對於資產管理,採取統一資料標準,對整體網路資產進行梳理和呼叫,避免資產資訊在運維繫統和實物間的差異,減少網路運維過程中資訊不一致、資料不統一等問題。從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,建立健全資產臺賬,實現一機一檔,透過自定義多級資產分類,細化資產類別,實現資產分類管控,提高資產精細管理程度。

電力電網行業IT運維方案



可量化運維工單體系

透過方案實現運維工單“無紙化”,支援於裝置和故障管理頁面快速建立工單,把控故障處理進度,透過工單平臺簡化故障處理流程,形成自動化故障處理機制,並在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。

電力電網行業IT運維方案


方案應用價值

隨著電力電網企業資訊化的不斷建設完善,新的應用和業務不斷擴充套件,不僅使網路的承載量增大,網路結構日趨複雜,對網路、IT設施的運維需求和標準日益增高。在部署智和信通統一運維監控方案後,以網、省兩級作為運維服務管控的樞紐,進行協同管理、指標聯動和對標評價,實現IT設施全面監管,實時掌控網路狀態,對網路的承載能力,進行準確的判斷,為網路擴容或最佳化提供依據。
本方案透過集中與業務相關的IT資訊,根據業務邏輯和IT資源之間的關聯關係進行視覺化建模,使用者可以在業務模型中的任何一點進行快速的根源問題分析和定位,大大提高了解決問題的速度和準確度,保障業務的穩定執行,幫助客戶實現從運維到運營,為電網業務的數字化轉型提供有力保障。

標杆案例

某電力科學研究院

在承建電力核心骨幹網——光晶片網路系統中,需要開發管理光晶片網路的EPON網路管理系統。在光晶片網路中,通常一個OLT裝置會連線8個PON 裝置,每個PON裝置會外接 1至8個ODN,每個ODN裝置可以外接多達64個ONU裝置。透過人工來維護這些龐大的裝置之間的關係,導致維護量巨大,而且非常容易出錯,在網路變化的時候,網路裝置關係來不及及時更新。
核心需求
實現對 EPON 系統中 OLT、ONU 裝置的配置、效能、安全和故障等方面的管理、監控和維護。 系統中裝置的配置、 狀態、 效能等資料來自 OLT 裝置中 ARM 系統獲取的 OLT、 ONU裝置的相關資料,並能透過列表、圖形、影像等方式進行展示、操作。
  • OLT、PON、ONU自動發現;
  • 故障監控、TRAP監控、效能採集、配置管理等功能;
  • 故障發現的要求更高,光晶片網路中,由於是承載國家電網核心業務,對故障發現的要求更高,期望在 1-3 秒鐘之內。
解決方案
智和網管平臺全面滿足使用者裝置拓撲、故障管理、效能管理、配置管理以及安全管理的網管需求,真正解決了使用者的裝置管控、功能實現、運營維護以及擴充整合難題。針對電力科學研究院的需求,智和信通提供如下具體解決方案:
  • 採用了自動化搜尋、智慧化發現的技術,網路管理系統在後臺自動發現網路裝置關係,並將裝置關係自動儲存在資料庫中,透過客戶端管理介面直接呈現當前最新的網路裝置連線關係和執行狀態。
  • 基於智和網管平臺,利用公司原有的拓撲圖元件、SNMP元件、網管軟體開發平臺、智慧化網管軟體產品的基礎上,滿足電力科學院對於新裝置和新功能的需求。
  • 網路管理系統層採用了故障實時接收和絕對優先上報機制,透過WebService介面技術,將故障快速地推送到管理員操作介面,做到了管理員透過介面發現故障的平均處理時間為1秒鐘以內。
方案成果
在以往方案中,透過人工來維護這些龐大的裝置之間的關係,導致維護量巨大,而且非常容易出錯,在網路變化的時候的,網路裝置關係來不及及時更新。在光晶片網路管理系統中,採用了自動化搜尋、智慧化發現的技術,網路管理系統在後臺自動發現網路裝置關係,並將裝置關係自動儲存在資料庫中,透過客戶端管理介面直接呈現當前最新的網路裝置連線關係和執行狀態。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011401/viewspace-2948527/,如需轉載,請註明出處,否則將追究法律責任。

相關文章