生產製造業網路運維監控方案

北京智和信通發表於2023-03-20

工業2.0實現“電氣化、機械化”,工業3.0實現“自動化、網路化”,工業4.0則旨在實現“數字化、智慧化”。隨著工業網際網路的發展,新興資訊科技和製造業的融合,生產製造產業不斷變革,企業開始高度重視“訂單供應-生產到流通”整個價值鏈的資訊化建設,ERP、SCM、CRM、MES、BPM以及其他外圍系統等都先後建設起來,但資訊系統建設的持續深入,資產規模不斷擴大,與之而來的是IT架構越來越複雜,雖然資訊系統深化和新技術的應用給企業業務及管理等方案帶來諸多收益,但也給企業的IT運維工作帶來諸多挑戰。

第1章 生產製造業網路資訊化的建設背景

《“十四五”智慧製造發展規劃》明確提出,到2035年,規模以上製造業企業全面普及數字化、網路化,重點行業骨幹企業基本全面實現智慧化。大型製造企業的廠區、事業部覆蓋全國乃至全球,由於業務種類多、生產鏈路長,每個廠區都有自己的業務特色。

生產製造業是多為生產現場-控制層級-監控層級-IT辦公的多級網路架構,生產現場、控制層級與監控層級屬於企業內網,即生產網(OT),IT辦公屬於企業外網,即IT網。生產現場常見裝置有生產機器、IO模組、閘道器、工業AP、工業接入級交換機等;控制層級常見裝置有PLC、工業級匯聚交換機等;監控層級常見裝置有核心骨幹交換機、伺服器、PLC、RTU等;IT辦公常見裝置有無線AP、膝上型電腦、攝像頭、雲設施、遠端會議裝置等。

 

縱觀工業網際網路的發展形勢,隨著IT與OT的逐漸融合,生產製造企業需面對業務多元化的應用場景。但由於諸多原因,生產製造業並沒有更大程度地發揮資訊化建設和IT/OT融合的價值,IT系統與業務結合不夠緊密,隨著企業規模的擴張以及業務需求日趨複雜,資訊化顯得累贅和笨拙,低效的資訊化應用和持續高漲的資訊化投入成為阻礙資訊化在企業進一步推進的障礙。

第2章 生產製造業網路運維需求及痛點分析

智慧製造要求生產製造企業從訂單到生產再到銷售,實現全流程的資訊化,而產線的持續改進、網路架構的持續建設等,為網路運維管理帶來諸多難題。對於資料中心,無法評估網路、應用容量的效能和網路故障對應用、業務所造成的影響,難以及時發現並定位網路問題;對於廣域網,由於應用、裝置分佈地域等詳細資訊缺失,故障排查被動且效率低下;對於園區網路,由於覆蓋面廣,網路架構複雜,傳統的人工巡檢、故障排查效率低下,同時缺少網路最佳化依據,具體而言,包括以下幾方面。

2.1. 跨越地域的多廠區網路專線,網路視覺化能力差

IT環境異構、裝置跨地域多廠區分佈,系統的軟硬體種類繁多,造成網路結構、鏈路關係無法視覺化展現,裝置節點位置不明確。

2.2. 網路結構複雜,難以有效監管

智慧製造技術的發展與業務的轉型升級使得生產製造企業的網路架構與業務系統架構變得日趨複雜,傳統的基礎運維工具無法應對。尤以在OT與IT不斷融合的當下,難以對生產網路、辦公網路中的IT資產、流量進行有效監控。

2.3. 網路故障頻發,難以快速定位排查

及時排障,是智慧製造保障安全生產的關鍵。大量的裝置、應用系統等產生大量故障,但由於缺乏有效手段對故障進行系統整合管理,難以實現告警收斂、異常檢測、根因定位、故障預測等,運維人員實際的工作效率較低,分析與定位故障困難。

2.4. 業務系統繁多,缺乏可用性監測

業務系統的合理規劃與及時調整,保障業務穩定,對生產製造企業至關重要。隨著業務系統不斷增加,運維工作中,缺乏對 MES、ERP、OA等業務系統的有效監控,對其可用性、健康度未能全面把控。

2.5. 自動化程度低,人力運維難度大

生產製造業IT運維多處於被動、低效率的手工救火狀態,對於故障的處理,往往在其發生後才得到處理,不但事倍功半而且故障還常常會出現惡性連鎖反應。大量變更和檢查操作工作每天重複進行,佔用大量的運維資源。

2.6. 運維資料分散,缺乏資料整合能力

缺失統一運維監控資料整合,資料過於分散,無法有效整合,造成各類監控工具之間資料彼此割裂,無法聯動分析的問題,無法實現監控資料最大化挖掘。

第3章 智和信通生產製造業智慧化運維方案

伴隨生產製造業資訊化建設與數字化轉型提速,網路和業務結構越來越複雜。工業4.0提出“資訊化技術促進產業變革”,運維部門與生產製造的關係越來越緊密。生產製造企業具有規模龐大的 IT 基礎設施及業務系統,運維部門為了保障生產、辦公資訊系統的高可用性、高可靠性、高穩定性,須建立智慧化、全面化的運維保障體系。

基於此,北京智和信通推出生產製造業智慧化運維方案,基於智和網管平臺,以智慧化、自動化、數字化為基底,為生產製造企業實現高效運維、保障業務持續穩定執行。

 

3.1. 智慧IT架構視覺化展示

對於生產製造業網路運維而言,網路跨廠區、裝置超大維護量是網路運維的難點,如何透過視覺化的能力,將複雜的網路直觀地展示出來,是其關注的重點。北京智和信通網路結構視覺化能力,透過圖形化、具象化的拓撲形式展現裝置間的聯動關係與實時狀態資訊,降低運維部門的維護難度,拖動式的佈局形式使配置更加靈活,幫助運維人員實時瞭解網路架構及全網執行狀態,快速感知資源、鏈路、流量等異常資訊。

 

生產製造業拓撲示意圖

在拓撲圖上展現裝置狀態,透過樹形、平面結構聯動展示裝置間連結關係,或按片區、按地域、按層級等多種佈局方式劃分網路,使用不同顏色、粗細、圖示表示被管理物件的狀態資訊,顏色級別自定義。

 

生產製造業拓撲示意圖

 

3.2. 動態掌控網路資源變化

透過多維管理檢視,對不同品牌、型別、版本的網路裝置、安全裝置、無線裝置、儲存、主機、中介軟體、資料庫、虛擬化、應用服務、工業交換機、物聯網裝置、影片監控、PLC裝置等IT資源進行統一、全方位、多層次的綜合管理,實時分析資源當前效能和執行狀態,直觀反映資源的動態變化對支撐業務的影響。

 

3.3. 端到端網路全鏈路監控

整體維度到區域性維度全面展示生產製造業網路內裝置鏈路各項指標,整體可觀測、可告警、可分析、可統計,透過SNMP協議實時監控各個埠以及每條線路的通斷情況和效能指標,結合專業的流量監控分析能力,對鏈路容量進行即時監控,並生成流量分析報告,為容量規劃提供依據。

 

3.4. 全方位採集告警資訊

提供7*24小時穩定不間斷監控,全面採集辦公和生產網路內所有聯網裝置,如影片裝置、無線AP、儲存、伺服器、路由器、工業交換機、防火牆等裝置、資源、應用、服務等的狀態資訊,基於告警機制以及閾值的設定,第一時間獲取準確的告警資訊,並透過介面顏色、告警列表、Email、釘釘、企業微信等方式發出通知,確保告警傳達到人,無錯漏。

 

3.5. IT資源自動巡檢

透過自定義巡檢策略,對IT裝置的執行情況進行統計和報表生成,並可自定義預設時間向指定郵箱傳送巡檢結果報表,實現對裝置的定期檢查,把握網路執行中的易出現問題的環節,做到預防為先。

 

3.6. 全網IP地址分配與管理

方案支援端到端規劃、部署、管理和監控IP 地址。透過手動或自動的方式獲取子網資訊,並根據網路結構對子網資訊進行管理。定時獲取全網的MAC-IP資訊,並自動儲存,可根據MAC或IP對線上裝置進行查詢。以埠圖的形式顯示當前網段內埠的使用情況。

 

 

3.7. 裝置模型庫監管無限制

採取使用者自定義裝置型別及其裝置資源的方式,賦予使用者自定義適配裝置的能力,最大可能地支援對不同裝置型別的支援。透過自定義裝置型別及其裝置資源,最大限度上提高了智和網管平臺的管理範圍,真正實現了對裝置及其資源的全面化管理,達到管控萬物的目標。

 

3.8. 智慧業務多維可視管理

生產製造業內的MES、ERP、OA等業務系統不斷擴充套件,產生巨大的業務運維壓力,智和信通業務運維方案以實現業務價值為核心,以保障業務可用性為基礎,透過對承載業務的IT基礎設施構建真實的業務模型。

透過智慧化、自動化的業務監管方案,將IT裝置對業務的價值視覺化,構建業務分析模型,從業務的角度透視IT設施的分佈和價值收益。在平臺內將業務相關的基礎設施和應用視覺化顯示並有效量化,將其狀態對映到他們所支援的業務上,直觀反映IT基礎設施的動態變化對業務造成的影響和威脅,實現IT的精細化管理,掌控全域性,準確衡量IT對業務的價值貢獻,有力保障業務的健康、穩定執行。

 

業務看板示意圖

針對業務應用效能與使用者體驗進行檢測分析,無需安裝外掛即可提供開箱即用的主動撥測試業務監測。直觀、便捷地幫助運維人員對企業內辦公OA系統、ERP系統、MES系統、PLM系統、WMS系統、財務系統等進行監控,掌握業務的執行狀態和健康水平,瞭解業務動態變化趨勢,快速定位故障源,降低運營風險。

3.9. 智慧實時監控網路流量

方案基於海量流量資料的儲存挖掘,實現對網路流量的偵測分析。透過網路流量分析技術,採集、分析、儲存所有網路流量,回溯分析資料包特徵、異常網路行為,以多維資料分析和深度挖掘為手段,實現資料包層面的流量追蹤,發現潛伏於網路中的未知攻擊。幫助使用者進行流量趨勢分析、網路最佳化、網路監控等工作,併為網路規劃、最佳化調整和業務發展提供基礎依據。

 

流量實時查詢展示瞬間流量狀態,定位瞬間異常流量的產生及影響範圍,透過TOP N排名報表,瞭解實時流量資料的排名情況、協議型別、應用分佈等,及時發現並準確定位流量的來源和目的及其細節特性,運維人員可以及時排除網路故障,提高運維效率。

3.10. 智慧故障自動觸發與治癒

方案透過統一的故障管理平臺,將各個模組中的監控資訊統一採集、分析,實現整個生產製造業中各種事件資訊、裝置故障、網路異常、流量異常等告警,以智慧化手段進行標準化的分析、壓縮、並歸關聯等,透過多種方式實時傳達告警資訊,保證落實到指定人員進行處理,幫助企業建立標準化、快速的故障響應機制,在遇到生產故障時,能夠有條不紊地進行分析與排障,提高安全生產故障的響應與處置能力。

 

將人工運維與故障自愈結合,無需針對告警進行手動處置,只需預編排告警處理流程,平臺根據場景自動觸發,實現故障自愈。透過實時發現告警,進行預診斷分析,判斷告警型別和級別,如果是一般告警,平臺進行自動恢復,如果是嚴重複雜告警則透過告警通知、運維工單等形式通知運維管理人員,進行人工處理。同時,將只能由專家處理的各類操作和判斷轉化為可存在於平臺內的流程,形成可保留可複用的運維知識。

 

3.11. 智慧IT資源遠端配置

方案提供跨廠區的裝置策略遠端配置管理,可以自動批次進行裝置配置修改,並可對裝置配置進行備份、對比、恢復。當機後裝置配置可快速復原,保障裝置及時恢復執行,全面提升配置效率、質量和安全性。

 

針對不同型別的裝置,支援進行各種控制、配置操作。

  • 對伺服器/主機/虛擬化,支援一鍵開關機、程式管理、應用管理、容量管理等

  • 對交換機/路由器,支援ACL、QoS、流量策略、埠策略等

  • 對安全裝置,支援防護管理、認證管理、NAT管理、VPN管理、內容控制等

  • 對資料庫/中介軟體,支援空間管理、池管理、會話管理、連線控制等

  • 對傳輸裝置,支援終端管理、鏈路管理、訊號控制、功率配置等

  • 對其他裝置,支援結合使用者實際場景,透過拖拽流程的方式實現自定義管控策略

對不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網路裝置。

3.12. 智慧視覺化資料分析

利用圖形、圖表、圖表等易於理解的形式,提取和分析大量複雜的生產製造業網路中各類運維資料,呈現分析結果,從而幫助運維人員在短時間內更好地理解和獲得更多的資訊,幫助運維部門能夠實時瞭解業務和其所依賴IT資源的執行狀況,以及提供系統運維和最佳化的指示和依據。

 

生產製造業大屏示意圖

3.13. 建立健全資產臺賬,實現一機一檔

IT資產從採購一直到報廢,要經歷多個生命週期。分析IT資產的生命週期,實行IT資產全生命週期管理,從資產入庫、領用、變更、維修、調撥、到報廢處置,資產每一步操作均實現完整記錄,支援追溯,透過平臺實現資產整個生命週期的全流程閉環管理,使得IT資產每一次生命週期變更,都有流程可依、都有章可循,從而實現全面的IT資產監管。

 

3.14. 智慧定製化工單體系

透過方案實現運維工單“無紙化”,支援於裝置和故障管理頁面快速建立工單,把控故障處理進度,透過工單平臺簡化故障處理流程,形成自動化故障處理機制,並在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。

結合生產製造業網路運維的需求實現定製化運維工單,透過自動觸發與使用者報修等方式快速響應運維事件,解決突發故障和請求,實現整個運維流程規範化、標準化,運維協同高效透明,運維結果可查可控。

 

 

第4章 全面適配國產軟硬體環境

以JAVA程式語言為基礎,從功能塊、資料庫、介面全部基於統一JAVA技術平臺和統一資料關係模型。智和信通國產信創能力採用Java、HTML5跨平臺技術,全面相容國產化作業系統、資料庫、中介軟體、CPU和虛擬化等,支援包括:中標麒麟、銀河麒麟、中科方德、達夢、人大金倉、南大通用、神州通用、華為虛擬化、H3C虛擬化、深信服虛擬化等。

 

方案以“管控萬物、無所不能、無處不在”為理念,具備拓撲自動發現、實時監控、效能感知、故障預警、流量分析、安全管控、自動化運維、裝置控制、作業編排、資料視覺化、資產管理、日誌分析、工單流轉和二次開發等核心技術模組,可在眾多國內外作業系統上應用部署,對國內主流的伺服器、中介軟體、CPU、資料庫均有完善的支援能力。

第5章 分散式部署方案適配生產製造企業網路架構

在智和信通生產製造業網路運維分散式部署方案中,採取核心網路部署綜合運維平臺,下級網路部署採集器的方式,使用者可以在綜合運維平臺建立多個賬號,進行許可權劃分,對下級網路進行管理。整個分散式部署方案採用綜合運維平臺-裝置集的結構,綜合運維平臺獲取不同裝置集的監控資訊,綜合運維平臺可以管理所有裝置,實現對每個裝置集中網路裝置執行資料的採集、管理、儲存。

部署方案優勢:

  • 增大平臺容量、吞吐量,管理效率更高

  • 可異地多點部署,網路可達即可完成監控管理

  • 降低採集服務之間的耦合度,更易於擴充套件

  • 故障影響範圍小,便於排查

 

第6章 方案應用價值

透過在企業總部、下屬板塊、生產園區部署智和信通智慧運維方案,將生產製造企業整體IT設施納入統一管理、資源視覺化與全面監控。實現OT網路高可靠、低時延、故障極速修復等運維能力;實現IT網路流量精細化管理、網路效能穩定、故障極速修復及網路安全回溯等能力。並透過極其靈活可控的自動化運維能力,將運維人員從簡單、重複的運維工作中解放出來,透過智和網管平臺將運維工作逐漸規範化、智慧化、自動化。

第7章 生產製造業樣板使用者

7.1. 日照鋼鐵視覺化運維專案

日照鋼鐵控股集團有限公司是一家集燒結、鍊鐵、鍊鋼、軋材於一體並配套齊全的特大型鋼鐵聯合企業,是一家民營企業。隨著集團公司的發展壯大,公司的辦公網路和生產網路也在同步發展,網路結構越加複雜,網路裝置數量不斷增加,以人工管理的模式難以對網路進行全面合理的管控。

7.1.1. 核心需求

為了更加便捷、高效地對辦公和生產網路進行管理,日照鋼鐵提出了以下核心需求:

  • 支援二級代理功能;

  • 支援自動發現網路裝置;

  • 具有拓撲圖,可以基於拓撲圖對裝置或資源等進行管理;

  • 全面的故障管理功能,能夠及時發現故障,有故障統計功能;

  • 透過系統對裝置進行配置和維護;

  • 提供便捷可用的介面,並提供介面培訓。

7.1.2. 智和信通方案

為實現日照鋼鐵的需求,智和信通和日照鋼鐵方面進行了多次深入地溝通,最終確定基於智和網管平臺在二次開發的方式來實現,具體方案如下:

  • 提供SNMP代理功能,透過代理實現對防火牆限制範圍內的裝置進行管理監控;

  • 代理支援一級、二級代理模式。一級、二級代理僅支援SNMP和Ping監控,支援JDBC、JMX、Telnet等;

  • 自動發現SNMNP裝置和IP裝置、發現交換機鏈路,自動執行監視任務,自動監控流量,自動展示監控圖表;

  • 支援在拓撲圖的基礎上,進一步展示裝置細節,包括網路裝置的網口和系統狀態,伺服器和計算機上的cpu、記憶體、磁碟、網路卡、程式服務、中介軟體、資料庫;

  • 具備全面的故障採集、故障分析、故障定位、故障處理、故障通知功能;

  • 可以方便地檢視網路裝置的各種配置資訊;整合Telnet、Ping、MIB瀏覽器、Web訪問、Ftp/TFTP等日常維護工具。

  • 平臺提供API介面,並提供API介面、介面使用、介面資料等。

7.1.3. 方案成果

透過部署智和網管平臺,日照鋼鐵將辦公和生產網路統一地管理起來,網路裝置集中管理,極大地提高了網路故障的處理效率。透過事前管理,降低故障發生率,透過事後及時處理,提高故障處理效率,為保障網路的平穩執行提供了極大的助力。

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70011401/viewspace-2940548/,如需轉載,請註明出處,否則將追究法律責任。

相關文章