SRE 實用指南:事件嚴重性級別 - rootly
事件嚴重性級別衡量事件對業務的影響。對問題的嚴重程度進行分類對於決定問題解決的速度和效率至關重要。
在不斷增長、規模龐大的公司中,事故是不可避免的。強大的事件管理策略最終會導致更好地管理和處理問題。它是可靠性工程的重要組成部分,可確保團隊準備好管理事件。它可以防止在發生違規或停機時損失數百萬美元的收入。良好的事件管理可改善客戶體驗,並使工程團隊能夠實現正常執行時間目標。
在此部落格中,我們將討論公司如何識別事件並確定其優先順序以加快解決速度。事件在表面上可能會有很大差異,因此必須根據特定的、明確定義的引數對它們進行分類。所有的事件都不是平等的。例如,高峰時段的系統中斷比大多數客戶睡著時的處理壓力要大得多。
我們可以將事件分為不同的嚴重性級別。您的嚴重性級別定義得越明確,您的團隊就越有可能在同一頁面上並能夠在事件發生時快速、適當地做出反應。
定義事件嚴重性級別
對嚴重性級別進行分類的第一步是確定應用程式或服務中最關鍵的流。它有助於確定事件的構成。我們可以使用“SEV”定義按嚴重程度對事件進行分類。SEV 編號較低的事件被視為“重大事件”,需要更敏捷的響應。在對嚴重性級別進行分類時,除了對業務的影響之外,我們還需要考慮各種因素。例如,應用在高峰時段當機將造成巨大的業務損失。
每個組織都需要了解他們的業務、團隊以及適合他們的 SEV 級別定義型別。一些組織將 SEV 級別分為 P0、P1、P2 等。
嚴重性級別分類
- SEV 0 或嚴重或 P0
本質上是災難性的故障,例如安全漏洞或導致目標受眾無法使用您的產品的完全中斷,將歸入 SEV0。它完全使業務陷入停頓,並可能導致收入和/或聲譽的損失。SEV0 事件通常沒有快速解決方法,需要整個工程團隊的協調努力才能解決此類事件。
- SEV 1 或 Major 或 P1
SEV1 事件是導致產品部分或完全中斷、具有變通方法或影響部分客戶的問題。與 SEV1 相比,SEV1 事件不是完全中斷,但仍會影響客戶體驗。例如,一個單一的特徵,例如購物網站中推薦系統的中斷,就是 SEV1 事件的一個例子。它會影響購物體驗,但仍然允許有限的業務透過。此類事件通常需要立即關注,但不如 SEV1 強大。
- SEV 2 或輕微/中度或 P2
在 SEV2 事件中,使用者可以照常完成操作,但會遇到輕微的麻煩和不便。繼續以購物網站為例,一些缺失的描述和影像可以歸類為 SEV2。此類事件有已知的快速解決方法,並且不難修復。
相關文章
- 談談BUG嚴重級別(severity)管理
- 最新CVSS 4.0漏洞嚴重性評級標準釋出
- 計算機史上最嚴重漏洞被公開,風險等級嚴重計算機
- 事件級別事件
- 軟體測試培訓分享:如何劃分bug的嚴重級別
- Oracle 11g 遇到log file sync嚴重等待事件Oracle事件
- MySQL 當中定位鎖爭用比較嚴重的表(中級篇)MySql
- ChatOps=AIOps落地+DevOps升級+SRE實踐AIdev
- Java的Fastjson庫爆高嚴重性RCE漏洞JavaASTJSON
- Chrome瀏覽器爆高嚴重性安全漏洞Chrome瀏覽器
- hang了,嚴重的row cache lock 等待事件--就因大sql文字事件SQL
- OpenLiteSpeed Web 伺服器被曝多個嚴重性漏洞Web伺服器
- 嚴重性10分,思科IOS XE零日漏洞正被利用iOS
- 盤點美國七大最嚴重的政府資料洩露事件事件
- 2013年最嚴重的十大資料洩露事件大資料事件
- 用Descriptor來實現類級屬性(Property)
- 【實驗】Oracle的serializable隔離性級別影響Oracle
- oracle ucm 的嚴重bugOracle
- mysql xtrabackup 遭遇嚴重bugMySql
- 暫緩MongoDB 4.4.2 、4.4.3、 4.4.4版本升級: 存在嚴重BugMongoDB
- 雅虎曝出史上最嚴重資料洩露事件:涉10億賬戶!事件
- VXFS啟用非同步IO導致的嚴重問題非同步
- UBC SDK日誌級別重複率最佳化實踐
- Git 實用指南Git
- Windows安全指南之域級別策略(轉)Windows
- 什麼是SRE工程師?SRE工程師和運維有什麼區別?工程師運維
- MySQL 之隔離級別:可重複讀MySql
- 嚴格模式和非嚴格模式區別模式
- 查當前的10046 事件級別事件
- win10卡頓嚴重怎麼解決 win10卡頓嚴重的解決方法Win10
- 看看這個超級實用的一種型別——匿名型別型別
- React Hooks 實用指南ReactHook
- webpack SplitChunksPlugin實用指南WebPlugin
- DataBinding實用指南
- 蘋果iOS再曝嚴重問題 2.5萬應用程式存在漏洞蘋果iOS
- 2018年上半年全球資料洩露事件嚴重程度指數一覽事件
- Facebook遭遇有史以來最嚴重當機事件,罪魁禍首與DNS故障有關?事件DNS
- 極狐GitLab 17.3 重點功能解讀 & 升級指南Gitlab