建設大型綜合運維平臺,對接整合多廠商網管系統

北京智和信通發表於2023-11-10

        當前,雲端計算、大資料、人工智慧等IT技術迅猛發展,企業的資訊化步入了一個嶄新的時代,企業規模不斷壯大,業務不斷擴充,企業資訊化依賴的網路結構和IT技術越來越複雜。因建設時期等原因,企業網路中分佈著不同時期、不同廠商、不同型號的IT裝置,運維人員需頻繁切換不同廠商的管理平臺對其進行管理,監控的效率不高,後期擴充套件困難,同時無法和企業的業務情況結合起來,無法提供足夠的安全管控功能,致使難以全面高效地開展運維工作。

        針對此種情況,北京智和信通提出多廠商網管統一運維方案,對接整合異構廠商的自有網管系統,運維人員僅需登入智和網管平臺一個軟體,即可對網路內所有的不同廠商的裝置進行管理,透過統一介面即可呼叫各裝置廠商網管的功能。

建設大型綜合運維平臺,對接整合多廠商網管系統 智和信通異構廠商裝置端到端監控運維架構

第1章  採用分級部署,高效管理海量裝置 

        採用智和網管平臺-裝置網管系統-裝置的結構,部署多級架構運維平臺方案,智和網管平臺獲取下級裝置網管的監控資訊,並進行集中展示。智和網管平臺可以管理所有裝置,裝置網管系統對本品牌的裝置進行管理。每級可以單獨監控各自的網路裝置,也可以由綜合運維平臺集中管理。實現上級智和網管平臺對各裝置網管中納管的網路裝置執行資料的採集、管理、儲存。

建設大型綜合運維平臺,對接整合多廠商網管系統 方案部署架構

部署方案優勢:

  • 異構廠商裝置集中管理,統一拓撲展示;
  • 可異地多點部署,網路可達即可完成監控管理;
  • 對於綜合網管-智和網管平臺,可對接下層裝置網管系統,支援完整的網路、裝置、資源、告警、事件等資料同步;
  • 對於各裝置網管系統,可完成其下裝置互動,可具有平臺完整的監控、管理許可權;
  • 下級裝置網管系統支援橫向水平擴充套件,隨著裝置廠商的增多靈活增設;
  • 可聯動資產、工單、統一告警等模組,提供一體化運維解決方案。


第2章 複用現有功能,實現異構廠商裝置集中管理

        憑藉多年運維開發經驗,北京智和信通全面支援與裝置廠商網管進行整合對接,目前已與華為、中興、華三、烽火、思科等裝置廠商的對接測試,智和網管平臺內拓撲觀測、綜合監控、業務分析、統一告警、資料分析展示、資產管理、工單等監控運維功能以及開次開發模組均可直接使用。

        (1) 拓撲觀測模組:提供直觀形象的拓撲圖繪製能力,以圖形方式輕鬆實現網路裝置、資源、鏈路狀態直觀展示,並以聲光進行告警提醒。透過一目瞭然的網路拓撲,為網路故障的實時發現和有效處理提供便利。

        (2) 綜合監控模組:以提供全方位網路監控功能,全面管理聯網裝置為目標,深入使用者需求,實現個性化網路監控解決方案。監控裝置型別覆蓋網路裝置、伺服器、交換機、中介軟體、資料庫、安全裝置、應用服務等;監測指標涵蓋連通性、可用性、負載、使用率、系統程式等。

        (3) 業務分析模組:前端使用者體驗、網路延遲到後端的業務服務和基礎架構,全棧溯源為使用者提供端到端的完整全鏈路資料融合和關聯分析,為使用者快速發現業務效能瓶頸,提升使用者體驗奠定基礎。

        (4) 統一告警模組:充分利用積累的有效定障、排障經驗,打通告警中心、監控中心、工單中心等關聯資料,實現從告警檢測到排障恢復的全生命週期閉環管理。

        (5) 資料分析模組:提供視覺化資料分析能力,對網路海量資料進行圖形化分析展示。透過直觀的圖表和圖形化手段清晰有效地將運維資料分析結果進行傳達,幫助使用者由宏觀到微觀更快地瞭解網路運維現狀,做出更具時效性的決策。

        (6) 資產管理模組:提供標準化資產錄入、個性化資產模板設定、自定義資產分類和資產二維碼管理等功能。透過資產管理模組將資產實物與運維資料庫一一對應,為使用者提供更加便捷高效資產生命週期管理,資產跟蹤、維護和統計分析。

        (7) 工單運維模組:具備基礎工單和運維工單能力,提供自定義工單模板、配置智慧工單服務水平(SLA)、我的工單、所有工單展示及實時工單狀態展示等功能。透過運維工單形成自動化故障處理機制,並在每個流程節點上責任到人,在快速響應故障的同時,兼顧企業流程管控。

        (8) 二次開發模組:提供6大開發模式,在智和網管平臺已有功能基礎上,支援模組式或程式碼式的開發形式,以便在短時間內滿足定製需求。同時提供全套開發資料及完善的培訓服務,支撐使用者隨心定製出運維監控平臺,並對平臺功能不斷更新,以滿足日益變化的管理需求。


2.1.打破異構品牌隔離,全網裝置集中展示

        整合各裝置廠商網管輸出的裝置資訊,在拓撲圖上以圖形方式輕鬆實現網路裝置及資源、鏈路狀態的整體觀測,並以聲光進行告警提醒。透過一目瞭然的網路架構呈現方式,提供高可用的網路態勢感知能力,為網路故障的實時發現和有效處理提供便利。

建設大型綜合運維平臺,對接整合多廠商網管系統

        以2.5D管理檢視對不同品牌、型別、版本的網路裝置、安全裝置、儲存、主機、中介軟體、資料庫、虛擬化、應用服務、影片監控、動力裝置、環境裝置等進行統一、全方位、多層次的綜合管理,實時分析資源當前效能和執行狀態,直觀反映資源的動態變化對支撐業務的影響。真實展示機櫃及櫃內裝置狀態,直觀呈現機櫃總U位數、使用U位數以及剩餘U位數,機房機櫃容量數字化直觀展示。

建設大型綜合運維平臺,對接整合多廠商網管系統

2.2.彙總各全網裝置關鍵指標,網路態勢綜合呈現

        將各裝置廠商網管輸出的關鍵指標資訊透過視覺化圖形的方式彙總、分析、呈現,實時反映網路態勢,助力使用者掌控網路變化趨勢

建設大型綜合運維平臺,對接整合多廠商網管系統

2.3.統一告警資訊處置,形成告警閉環管理

        一體化集中管理各裝置廠商網管系統生成的告警資訊,橫跨網路監控、日誌管理、流量透視、IP合規監測應用等場景,全量匯聚異常告警資訊,基於故障模型和AI演算法分析故障原因,分析、壓縮、並歸關聯故障資訊,降低故障風暴,秒級定位故障位置,主動出擊快速排障,故障處置全流程展示。

建設大型綜合運維平臺,對接整合多廠商網管系統

        平臺提供介面顏色、聲光、告警列表、Email、釘釘、企業微信等多種通知渠道,告警通知無延遲,告警渠道全覆蓋。告警可以向上逐步追溯,按照從全域性→網路→裝置→資源的管理習慣來組織故障顯示。

        支援快速的故障定位,能一步定位到發生故障的源頭裝置,及時處理好故障,有效地預防故障發生。支援以拓撲圖的方式回放歷史告警下的裝置告警變化、拓撲圖和鏈路告警變化,支援快進、後退等播放操作。

        告警發生中,自動關聯調取內建的故障處置預案,協助運維人員進行排障處理;透過觸發告警自愈及自動派單能力,快速實現排障處置;在故障消失後,系統能自動檢測到先前故障,並作自動清除告警處理。

        全面採集告警資訊,將告警資訊資料按照時間、資源、效能型別等多種維度以圖表等形式展現。透過豐富的、可自定義的多維度報表,實現平臺內所有模組告警的統一管理分析,從變化趨勢、告警關聯、排障處置等多方面、多視角洞察告警態勢。

        將各類運維操作、故障判斷等經驗,轉化為存在於平臺內的知識,形成團隊知識庫,提升整體運維效率。

建設大型綜合運維平臺,對接整合多廠商網管系統

2.4.從人工到自動化跨廠商裝置巡檢

        傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規範、標準,導致巡檢的範圍和深度都存在一定的侷限性,並且是基於人工的手工統計,工作效率比較低,同時耗費較大的人力資源。本方案依託平臺將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略,日常例行巡檢、節假日和重要事件前的巡檢均可自動化執行。

建設大型綜合運維平臺,對接整合多廠商網管系統

        透過制定統一的巡檢指標、巡檢方式、巡檢頻度等,保證巡檢標準化、巡檢範圍、巡檢深度;透過設計巡檢作業、資料採集方式、自動化作業排程等實現日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。

2.5.日誌與事件集中管理,異常自動轉告警

        將事件和告警分離管理,接收裝置/伺服器主動傳送的訊息,集中處理後,及時地通知使用者,並可以透過集中的管理介面進行管理。透過智慧解析策略,將異常資訊自動轉化為告警資訊,由統一介面集中展示,極大地提高了管理的主動性,降低了管理的難度。

建設大型綜合運維平臺,對接整合多廠商網管系統

2.6.IP地址分配與管理

        方案支援端到端規劃、部署、管理和監控IP 地址。透過智慧IP掃描能力,定義多層次子網,然後掃描其範圍內每個IP地址的當前狀態,包括IP地址,MAC地址等資訊,也可以檢視IP段內地址使用詳情,便於學校進行IP地址分配管理等。

可手動、自動獲取子網資訊,並根據網路結構對子網資訊進行管理。定時獲取全網的MAC-IP資訊,並自動儲存,可根據MAC或IP對線上裝置進行查詢。以埠圖的形式顯示當前網段內埠的使用情況。

建設大型綜合運維平臺,對接整合多廠商網管系統

        支援透過埠檢視及列表檢視的形式,展示當前IP地址的使用情況,可檢視某個子網的IP現網詳情資訊,如IP、掩碼、主機名、裝置型別、現網MAC、現網接入裝置、現網接入埠、規劃MAC、規劃接入裝置、使用人等,可批次分配IP地址。

建設大型綜合運維平臺,對接整合多廠商網管系統

        透過追蹤IP地址的歷史關聯MAC、接入裝置/埠變更記錄等與規劃繫結MAC、規劃接入裝置/埠進行對比分析,當與規劃不一致時生成一條異常記錄,從而稽核IP/MAC是否正確使用。透過黑白名單功能用來檢測使用者所關心的裝置是否在網路中出現及出現時間。支援配置黑名單或白名單,智慧劃撥規劃表中的IP、MAC設定為白名單策略,對非法接入裝置進行告警處置。

        對全網MAC和IP進行配對繫結,並週期性對MAC-IP進行檢測。自動將規劃表中的IP-MAC設定為繫結關係,自動掃描線上終端,當IP-MAC的繫結關係發生衝突時產生告警,保證入網終端安全可信。

2.7.彈性擴充套件,滿足網路發展需求

        對於沒有自身網管系統的裝置,可透過智和網管平臺直接納管,支援裝置及資源彈性伸縮,滿足網路中裝置量持續增長及更新的需求。可對裝置型別模型進行擴充套件,可自定義新裝置的型別、圖示、型別識別策略;可對裝置資源模型進行擴充套件,自定義新裝置型別的網口、指示燈、風扇、電源的圖示、識別發現策略;可自定義裝置皮膚圖,以拖拽、滑鼠操作完成裝置皮膚模板的製作;支援故障和效能擴充套件。

建設大型綜合運維平臺,對接整合多廠商網管系統

        透過自定義裝置型別及其裝置資源,大限度上提高了智和網管平臺的管理範圍,真正實現了對裝置及其資源的全面化管理,達到管控萬物的目標。

第3章 跨廠商裝置管理,構建端到端業務運維體系

        透過構建業務系統與部門、IT資源及關鍵指標的關聯關係,整合前端、應用、後臺任務、外部服務、資料庫及基礎設施,直觀呈現面向服務的業務系統體系架構;透過影響傳遞,準確反映裝置異常對核心業務、使用者造成的影響和威脅,並對造成業務影響的故障進行實時告警,快速查明導致業務中斷的故障源,幫助運維人員做出及時響應,保障業務連續性。

3.1.業務可用性撥測分析

        針對業務應用效能與使用者體驗進行檢測分析,無需安裝外掛即可提供開箱即用的主動撥測試業務監測。從前端使用者體驗、網路延遲到後端業務服務和基礎架構,全棧溯源為使用者提供端到端完整全鏈路資料融合和關聯分析,為使用者快速發現業務效能瓶頸,提升使用者體驗奠定基礎。

建設大型綜合運維平臺,對接整合多廠商網管系統 業務看板示意圖

        直觀、便捷地幫助運維人員對業務、應用進行監控,掌握業務的執行狀態和健康水平,瞭解業務動態變化趨勢,快速定位故障源,降低運營風險。

3.2.全量業務呼叫鏈追蹤

        方案實現完整全鏈路呼叫鏈追蹤,包含詳細的呼叫鏈訪問路徑和效能等訪問資訊,以及相關的各類請求引數等業務資料指標,為故障定位、根因分析提供詳盡的參考資料。

建設大型綜合運維平臺,對接整合多廠商網管系統 業務全景示意圖

        透過構建包含各業務整體流程的呼叫依賴關係圖譜,展示業務部署中網路裝置間多維度關係拓撲。對從業務的前臺受理到真正完成的整個業務流程所依賴的業務應用、伺服器、中介軟體、資料庫、作業系統等進行實時監控分析,透過視覺化的方式呈現業務健康狀況,聯動裝置監控,快速定位導致業務健康指數波動的原因,保障核心業務流程穩定、高效。

3.3.業務瓶頸根因定位

        方案透過全面的業務資料視覺化能力,既可集中呈現業務資料的使用者體驗狀態,也可以基於應用、裝置實時監控、呈現業務各節點的實時執行狀態,包括使用者體驗、節點可用性、節點負載等狀態資訊。基於自定義閾值自動監測,異常指標自動觸發告警,快速定位業務瓶頸根因,並可根據使用者自愈策略,觸發自動運維實現故障自愈。

建設大型綜合運維平臺,對接整合多廠商網管系統

第4章 整合各裝置網管監控資料,視覺化展示

        異構網路中各廠商網管系統及各業務系統產生的海量資料無法得到深層次的應用,管理者決策缺乏資料依據,難以參考各類網路業務指標、資料等實現對執行態勢、隱患風險的實時掌控及運營管理。

        為解決此難題,智和信通混合雲智慧運維方案對全網運維資料進行整合分析、分層級地進行直觀的圖形、圖表、圖例等展示,從而幫助運維人員在短時間內更好地理解和獲得更多的資訊,幫助運維中心能夠實時瞭解業務和其所依賴IT資源的執行狀況,以及提供系統運維和最佳化的指示和依據。

4.1.監控運維駕駛艙

        適配各種應用場景,二十四小時不間斷監控,細粒度可達網路中每個裝置、資源和鏈路。所有的網路故障都一目瞭然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網路提供了可靠的保證。

建設大型綜合運維平臺,對接整合多廠商網管系統 運維大屏示意圖

4.2.多裝置效能對比報告

        方案支援選擇多裝置進行同維度效能資料分析,提供視覺化效能對比檢視。如使用者獲知宿主機的CPU利用率逐漸增加,即可對其中的虛擬機器效能進行對比分析,以定位高消耗的虛擬機器,快速找到效能瓶頸節點。

建設大型綜合運維平臺,對接整合多廠商網管系統

4.3.多維度資料分析展示

        提供多維資料的統計功能,並透過多種型別的圖表展現,使使用者對整體網路有一個全面直觀的瞭解,透過資料分析,全面把握網路狀況為決策提供依據。

建設大型綜合運維平臺,對接整合多廠商網管系統

第5章 更多協同運維能力,提升異構裝置運營價值

5.1.資產整合管理

        對於企業各類資產管理,採取統一資料標準進行梳理和呼叫,避免資產資訊在運維繫統和實物間的差異,減少網路運維過程中資訊不一致、資料不統一等問題透過平臺將資產實物與運維資料庫一一對應,解決網路裝置在日常運維過程中出現“脫管”或“半脫管”的問題。

建設大型綜合運維平臺,對接整合多廠商網管系統

        建立健全資產臺賬,實現一機一檔,透過自定義多級資產分類,細化資產類別,實現物資資產、虛擬資產、雲資產分類管控,透過在橫向上納管異構雲平臺,在縱向上理清異構跨層級資產間的對應關係,從根本上解決IT資源割裂、分散的問題,提高資產精細管理程度。

        從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支援追溯,透過平臺實現資產整個生命週期的全流程閉環管理,使得IT資產每一次生命週期變更,都有流程可依、都有跡可循,從而實現全面的IT資產監管。

建設大型綜合運維平臺,對接整合多廠商網管系統

5.2.運維工單無紙化流轉

        透過方案實現運維工單“無紙化”,支援於裝置和故障管理頁面快速建立工單,把控故障處理進度,透過工單平臺簡化故障處理流程,形成自動化故障處理機制,並在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。

建設大型綜合運維平臺,對接整合多廠商網管系統

        透過建立工單服務基準,預設工單在不同優先順序、不同狀態時,受理人應該響應的時間及未響應時的處理方式,生成工單自動化處理規則,並以多種方式進行通知,避免超時響應提升全流程服務管理質量。

5.3.全網頻寬、流量透視

        隨著政企使用者數字化轉型和上雲的加速,其業務、應用層出不窮,對網路頻寬的需求越來越高,正常的業務需要良好的頻寬環境保障機制,避免被一些與業務無關的雜事干擾,影響工作效率。方案對混合雲路網路全域性流量和頻寬實時監控,將出入雙方向流量情況視覺化展現。基於海量流量資料的儲存挖掘,統計分析流量峰值、谷值、流量趨勢、裝置流量等資料,為網路流量管理提供資料支撐。

建設大型綜合運維平臺,對接整合多廠商網管系統

第6章 相容信創國產生態

        智和信通提供的信創運維方案,立足於北京智和信通10年的國產融合經驗,與國產軟硬體產品深度適配,方案所涉及的產品與模組,均由北京智和信通自主研發,從功能模組、資料庫、介面全部基於統一Java技術平臺和統一資料關係模型,不包含任何第三方功能庫。

建設大型綜合運維平臺,對接整合多廠商網管系統

        方案實現對國產雲、信創雲、國產伺服器的統一納管,也支援在中標麒麟、銀河麒麟、紅旗Linux等國產作業系統上執行,支援在達夢、金倉、神州等國產資料庫進行資料儲存,透過東方通等國產中介軟體提供對外服務,支援龍芯、申威等國產CPU架構,助力使用者業務應用的國產化環境改造。在支撐使用者構建信創環境的同時,也針對各類信創裝置、服務元件等提供相應的運維服務,在降本增效的同時,促進政企使用者業務創新發展。





來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011401/viewspace-2994789/,如需轉載,請註明出處,否則將追究法律責任。

相關文章