《資料安全能力成熟度模型》實踐指南06:網路可用性管理

資料安全發表於2021-02-22

《資訊保安技術 資料安全能力成熟度模型》(GB/T 37988-2019)簡稱DSMM(Data Security Maturity Model)正式成為國標對外發布,並已於2020年3月起正式實施。美創科技將以DSMM資料安全治理思路為依託,針對各過程域,基於充分定義級視角(3級),提供資料安全建設實踐建議,形成系列文章。本文作為本系列第六篇文章,將介紹資料傳輸安全階段的網路可用性管理過程域(PA06)。

 

隨著《中華人民共和國資料安全法(草案)》的公佈,後續DSMM很可能會成為該法案的具體落地標準和衡量指標,對於中國企業而言,以DSMM為資料安全治理思路方案選型,可以更好的實現資料安全治理的制度合規。


《資料安全能力成熟度模型》實踐指南06:網路可用性管理DSMM三維立體模型




《資料安全能力成熟度模型》實踐指南06:網路可用性管理資料生命週期安全過程域


 

DSMM將6個生命週期進一步細分,劃分出30個過程域。這30個過程域分別分佈在資料生命週期的6個階段,部分過程域貫穿於整個資料生命週期。

本文作為《資料安全能力成熟度模型》實踐指南系列第六篇文章,將介紹資料傳輸安全階段的網路可用性管理過程域(PA06)。

 

01定義

網路可用性管理,DSMM官方描述定義為透過網路基礎設施及網路層資料防洩漏裝置的備份建設,實現網路的高可用性,從而保證資料傳輸過程的穩定性。

DSMM標準在充分定義級對網路可用性管理要求如下:

1)       組織建設

組織應設立負責網路可用性管理的人員或團隊。


2)       制度流程

應制定組織的網路可用性管理指標,包括可用性的機率數值、故障時間/頻率/統計業務單元等;基於可用性管理指標,建立網路服務配置方案和當機替代方案等。


3)       技術工具

Ø  應對關鍵的網路傳輸鏈路、網路裝置節點實行冗餘建設;

Ø  應部署相關裝置對網路可用性及資料洩漏風險進行防範,如負載均衡、防入侵攻擊、資料防洩漏檢測與防護等裝置。

 

4)       人員能力

負責該項工作的人員應具有網路安全管理的能力,瞭解網路安全中對可用性的安全需求,能夠根據不同業務對網路效能需求制定有效的可用性安全防護方案。

 

02實踐指南

1)     組織建設

美創科技專家認為組織機構在條件允許的情況下應該設立一個網路可用性管理部門以及招募相關的人員負責管理公司的網路可用性,為公司制定整體的網路可用性管理方案和標準,包括制定可用性的標準數值、故障指標、故障處理方案等,對公司的網路節點、傳輸鏈路進行考察,並部署相應裝置保障網路可用性、防止出現資料洩露等風險,同時還應根據公司不同的業務環境所提出的各種網路效能需求制定有效可靠的資料安全防護方案等。


2)     人員能力

針對網路可用性管理部門的相關人員,必須具備良好的資料安全風險意識,熟悉國家網路安全法律法規以及組織機構所屬行業的政策和監管要求,在進行網路可用性管理的時候主要依據《網路安全法》中的相關要求,對公司的網路可用性做好管理與保護,除此之外,還需要相關人員具備良好的網路架構基礎,熟悉公司內部的網路結構和環境,熟悉常用的網路安全防護裝置,熟悉常見的網路威脅手段,能夠在公司內部的網路環境中根據不同部門或業務對網路環境的不同要求,制定高效可靠的網路安全防護方案,網路可用性管理方案等,並推動相關要求確實有效的落地執行。

 

針對業務團隊的技術團隊人員,必須具備足夠的網路裝置搭建經驗,網路裝置維護管理和網路可用性維護管理等經驗,瞭解業務團隊的所有業務環境,具備一定的應急響應能力,在面對突發性網路癱瘓的情況時,應及時進行應急處置,並上報網路可用性管理部門,進行溯源排查等。


3)     落地執行性確認

針對網路可用性管理人員能力的實際落地執行性確認,可透過內部審計、外部審計等形式以調研訪談、問卷調查、流程觀察、檔案調閱、技術檢測等多種方式實現。


4)     制度流程

Ø   網路可用性管理指標

可用性指系統或元件在指定的條件和時間內,維持其規定功能的能力,通常以百分比標識並能綜合反映裝置的可靠性和可維修性。美創科技專家認為影響網路可用性的主要因素有網路的設計結構、裝置的可靠性、傳輸介質和裝置執行環境因素。網路可用性常用到以下指標:

①平均無故障時間(Mean Time Between Failures,MTBF),即整個網路的各元件(鏈路、節點)不間斷無故障連續執行的平均時間。MTBF越大,表明越不容易出故障,可用性自然高。MTBF反映的是網路的可靠性(reliability);

②平均修復時間(Mean Time To Repair,MTTR),即從故障發生到故障消除所需要的平均時間。MTTR越小,表示故障時間越短,可用性也就越高。出現故障後,要經過檢查、識別、定位、修復和核查過程,還可能出現技術延遲和後勤延遲,MTTR不僅與裝置的種類和所在位置有關,與是否使用網路管理系統及該系統的響應速度和告警能力有關,還與維修隊伍的整體素質(包括體質、管理、責任心、維修支援能力等因素)有關;

③可用度(Availability):可用性的定量描述;

④不可用度(Unavailability):與可用度相對;

 

Ø   提高網路可用性

①在網路規劃設計階段,需要細緻分析業務模型,確定基礎網路拓撲,對影響網路可用性的關鍵節點和鏈路必須做充分的冗餘設計,並根據網路結構,在各個層次、各個節點部署合適的高可用性技術。

②在元件或裝置選型時,除保證技術指標外,也要有足夠高的可靠性指標。

③持續進行網路維護和最佳化。利用高效的網路裝置管理工具持續監控、分析、預測、最佳化,最大限度的規避網路擁塞。

④在進行軟硬體版本升級或新裝置,新業務上線時,需要事先詳細規劃,制定應急預案。

⑤高度關注網路安全問題。定期對主機系統和網路系統進行安全評估,構建一個多層次的安全防禦和預警系統。

⑥做好業務系統和網路系統的協調。積極分析業務模型,並適當的進行調整,可以讓網路更通暢。

 

Ø   網路服務配置原則

①層次化:分層次設計網路結構,嚴格定義各層次的功能;

②模組化:根據區域劃分拓撲結構;

③可擴充套件:根據業務發展需要,透過簡單複製模組單元來擴充網路;

④冗餘設計:提供裝置和鏈路的冗餘保護;

 

Ø   網路可用性管理規範

①設定網路可用性管理部門,負責網路及其元件裝置的日常維護以及網路故障的應急工作,全面負責可能出現的各種突發事件處置工作,並協調解決網路故障處置工作中的重大問題。

②網路故障發生前,網路可用性管理部門需預先對網路故障預警預報體系進行建設,編制網路故障防治規劃。

③網路可用性管理部門需加強對網路及各元件的日常監測及其日誌儲存工作,發現險情時,需及時向領導小組報告。

④網路可用性管理部門要嚴格執行值班制度,以保障最先發現網路故障並及時處置次突發事件。

⑤建立健全網路故障速報制度,保障突發性網路故障資訊可立即釋出預警。

⑥網路故障發生時,立即啟動應急預案,採取應急處置程式,判定網路故障級別,並立即向領導小組報告。在網路故障處置過程中,應及時報告網路故障處置工作的進展情況,直至故障修復。

⑦網路故障消除後,由網路可用性管理部門向領導小組宣佈網路故障應急期結束,並予以公告,同時預案終止。

 

5)     技術工具簡述

資料在網路傳輸過程中依賴網路的可用性,一旦發生網路故障或者癱瘓,資料傳輸也會受到影響甚至中斷。網路可用性管理過程域的設定,即要求建設高可用性的網路,從而保證資料傳輸過程的穩定性。所謂網路可用性並不是單純的網路裝置、伺服器或節點的通斷,而是一種綜合管理資訊,以反映支援業務的網路是否具有業務所要求的可用性。網路系統的可用性包括:鏈路的可用性,交換節點的可用性(如交換機和路由器),主機系統的可用性,網路拓撲結構的可用性,電源的可用性以及配置的可用性等。但由於網路節點與網路鏈路的故障無法完全避免,因此構建高可用性網路的基礎就是要實現快速故障發現和快速故障恢復,在這個過程中涉及相關的檢測手段及冗餘措施。

目前網路可用性的主要考核指標公式可參考以下

網路可用性的計算公式:

A=MTBF/(MTBF+MTTR)*100%

DT=(1-A)*365*24*60



《資料安全能力成熟度模型》實踐指南06:網路可用性管理公式字元指標說明


 

從上述公式我們可以看出,為了提高網路可用性,我們需要儘量的提高平均故障間隔時間(MTBF),即保證網路在規定時間內不出故障或少出故障,主要的措施有避錯和容錯機制。同時降低平均修復時間(MTTR),即網路出了故障要能迅速修復,主要措施時快速檢錯和快速排錯(恢復)。因此主要有4方面技術方法來提高網路可用性。


Ø   避錯措施

避錯就是透過改進硬體的製造工藝和設計,選擇技術成熟可靠的軟硬體等策略來防止網路系統的錯誤產生,從而提高網路的可靠性,並透過可靠性來提高網路的可用性。

避錯方法包括各種硬體、軟體和管理措施。

①硬體避錯方法是透過改進硬體的製造工藝和設計,防止錯誤的產生,包括網路中電氣系統的避錯、網路裝置的避錯、伺服器的避錯和網路中傳輸媒體的避錯等。

②軟體避錯方法包括形式說明、過程管理、軟體測試和程式設計技術選擇等,例如網路應用系統的避錯和成熟可靠的網路作業系統的使用等。

③管理避錯方法要求網路執行管理要嚴格按照規範進行,包括制度建設、任務分配、裝置標識、規範文件記錄、各種軟硬體日常維護和網路安全管理標準等,例如管理資訊儲存的避錯、網路中網路結構選擇的避錯和日常網路管理的避錯等


Ø   容錯機制

避錯方法可以提高網路可靠性,但無論多麼可靠的系統都會出現系統失效,光靠避錯方法不能完全解決系統的可靠性,因此透過容錯技術,外加冗餘資源消除單點故障使系統在單點故障中仍能正常工作。冗餘資源主要包含三塊:硬體冗餘、軟體冗餘、路由冗餘。


Ø   快速檢錯

實現快速檢錯包括故障檢測和故障診斷兩方面,故障檢測的作用是確定故障是否存在,故障診斷的作用是確定故障的位置。一般快速檢錯是從故障現象出發,以網路診斷工具為手段獲取診斷資訊,確定網路故障點,查詢問題的根源具體包括:

①自動檢錯而不是人工檢錯可以更快提高檢錯的速度;

②藉助線路檢測工具(如線纜測試儀、時間域反射計)可以加快線路故障的檢錯速度;

③利用網路管理系統專門的管理程式不斷地檢測路由器的關鍵資料並及時給出報警可以加快路由器故障的檢測速度;

④透過工具自動監視主機流量、掃描主機埠和服務來檢測主機的異常,可以加快主機故障的檢測速度;

⑤利用網路測試儀可以自動定位網路故障源,找出故障點並顯示其網路相關資訊,從而加快邏輯故障的檢測速度;

⑥利用網路分析工具進行快速檢錯,如協議分析程式Snigger,作業系統中內建的一些非常有用的軟體網路測試工具等;

 

Ø   快速排錯(恢復)

排錯事在網路出現故障時,逐一排除故障,恢復系統的可用性。網路故障排錯的方法分為:

①分層故障排錯法:它主要根據網路分層的概念進行逐步分析的方法;

②分塊故障排錯法:此方法從裝置的配置檔案入手,將配置檔案分為管理部分、埠部分、路由協議部分、策略部分和接入部分,並對其逐一進行檢查排錯;

③分段故障排錯法:此方法是把網路分段,逐段排除故障;

④替換法:替換法是檢查硬體問題最常用的方法。如懷疑是網線問題時,更換一根確定完好的網線嘗試。

 

受限於篇幅,美創科技技術專家不再對此處技術工具進行進一步展開,在網路系統的不同建設階段,我們可以選擇性的引入不同的技術工具,這裡我們按照網路系統建設的三個階段:網路系統設計期、網路系統建設期、網路系統維護期來理解技術工具的使用

 

Ø   網路系統設計期:網路系統設計期的時候,網路系統還處於不完整的狀態,在這個階段,可以根據避錯措施中涉及的各方面,對網路系統涉及到的硬體、軟體進行選型,在經濟許可的情況下,選擇技術成熟可靠的軟硬體等策略來防止網路系統的錯誤產生

Ø   網路系統建設期:網路系統建設期時,此時網路基本可用,為防止突發的網路事故導致網路不可用的情況,此時引入容錯措施,透過硬體或軟體的負載均衡增加網路可靠性。


《資料安全能力成熟度模型》實踐指南06:網路可用性管理系統建設期引入容錯措施



Ø   網路系統維護期:透過前面的避錯、容錯措施的建設,網路可用性大大增強,同時網路出錯的機率也大大降低,此時主要是針對日常網路系統的監控、檢錯、排錯,使用相關技術工具,不斷減少平均修復時間,從而實現網路可用性的全維度把控。

 

網路可用性管理過程域的實踐指南就展開至此,《資料安全能力成熟度模型》實踐指南系列持續更新中,歡迎持續關注。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69973247/viewspace-2758428/,如需轉載,請註明出處,否則將追究法律責任。

相關文章