[原創]淺談網際網路企業故障定級

賣燒烤的魚發表於2017-05-14

[原創]淺談網際網路企業故障定級

  相信各位所在的網際網路企業,都會有對故障級別的定義,不管是做金融,電信,遊戲,還是社交等,故障這個詞永遠不陌生,今天來談下對故障定級應如何去考慮。

首先,來談談什麼是故障?系統上線後,一般都會正常運營,如果出現一些非不可抗拒因素造成的對系統服務中斷或是發生非預期的行業,都可以稱為故障。通常多數公司都會按嚴重性來區分故障定級,雖然是一個很好的方法,但有時技術人員會絕得,我很短時間就恢復了,並沒有造成很大的損失,所以個人絕得故障也要有時間維度,總結如上所說,我們就將按嚴重性危害和時間二個大的維度來定義。

  故障定級,一般我們會去定義5級,具體如下:

1級 系統中斷2小時以上  造成大範圍影響使用(一般出現主要的領導是要背責的);

2級 系統中斷30分鐘-2小時之間    造成大範圍影響使用;

3級 系統重要模組出現問題,影響大量使用者投訴;

4級 系統次要模組出現問題,影響部分使用者投訴;

5級 系統資要模組出現問題,有少許影響造成投訴;

  通常各公司故障定級大同小異,與我上面描述都差不了多少,只是具體的邊界限定各公司標準不一樣,個人認為一個成熟的公司至少都應有上面如述要求;但是我們發現沒這個定義去恰恰少了一些重要考慮因素,是什麼呢?錢,如果出了故障很小範圍,影響面小,但會給公司造成損失,難道不考慮嗎?所以在網際網路金融系統中,對故障尤其是資金安全也會做為一條衡量系統故障級別的考察點,一般我們定義如下:

  如果給公司或使用者造成50000元損失,將認定為1級嚴重故障或是事故(一般出現主要的領導是要背責的);其它各級別定義,我就不在詳述,基本上大同小異,重要的考考慮問題及思考的角度。

  

 

相關文章