阿里雲解釋史上最長大規模中斷:機房溼了

reed821發表於2022-12-26

我是盧鬆鬆,點點上面的頭像,歡迎關注我哦!

據DNSAdmin爆料:阿里雲解釋了12月18日史上最長大規模中斷(15.5小時)的4大問題。12月25日,阿里雲官方釋出說明,詳細解釋了此次中斷故障的過程、原因,以及改進措施。

簡而言之就是:阿里雲冷機故障,引起了機房高溫,高溫觸發了消防噴淋,因為機器溼了,很多機器遇水損壞了,所以修了15個半小時。

阿里雲解釋史上最長大規模中斷:機房溼了

據悉,阿里雲此次服務中斷源於水冷系統出現故障,且長時間無法恢復正常,導致機房溫度升高,現場處置不及時又導致觸發消防噴淋,部分硬體遇水損壞,另外客戶在香港地域新購ECS等管控操作失敗,長時間無法擴容。從當天早上8點56分首次檢測到故障警告,次日凌晨0點30分所有服務恢復正常,歷時超過15個半小時。

阿里雲承認,此次香港Region可用區C服務中斷事件,對很多客戶的業務產生重大影響,也是阿里雲運營十多年來持續時間最長的一次大規模故障。並向所有受到故障影響的客戶公開致歉,稱將盡快處理賠償事宜。阿里雲表示,將盡一切努力從此次事件中吸取經驗教訓,持續提升雲服務的穩定性。

不過話說回來,阿里雲當機了,就跟特斯拉自燃了一樣,大家依舊會用阿里雲。但這次事件對阿里雲來說是一次大危機,一秒上億的交易量竟然能當機這麼久,要修15個小時?難以想象是做了十幾年的雲服務廠商。不過話說回來,運維人員一定演練過各種疑難雜症,技術方面肯定沒得說,但誰曾想到,伺服器竟然是以這種形式損壞了。

另外還想說一點阿里雲出了這種問題,它不是第一時間處理問題,而是去到處投訴侵權,有幾個相關的報導文章就被阿里雲投訴說侵害了他們的名譽權,要求立刻刪除文章。

阿里雲解釋史上最長大規模中斷:機房溼了

文章來源:盧鬆鬆部落格,歡迎關注我的賬號哦!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69979355/viewspace-2929447/,如需轉載,請註明出處,否則將追究法律責任。

相關文章