阿里雲解釋史上最長大規模中斷:機房溼了
我是盧鬆鬆,點點上面的頭像,歡迎關注我哦!
據DNSAdmin爆料:阿里雲解釋了12月18日史上最長大規模中斷(15.5小時)的4大問題。12月25日,阿里雲官方釋出說明,詳細解釋了此次中斷故障的過程、原因,以及改進措施。
簡而言之就是:阿里雲冷機故障,引起了機房高溫,高溫觸發了消防噴淋,因為機器溼了,很多機器遇水損壞了,所以修了15個半小時。
據悉,阿里雲此次服務中斷源於水冷系統出現故障,且長時間無法恢復正常,導致機房溫度升高,現場處置不及時又導致觸發消防噴淋,部分硬體遇水損壞,另外客戶在香港地域新購ECS等管控操作失敗,長時間無法擴容。從當天早上8點56分首次檢測到故障警告,次日凌晨0點30分所有服務恢復正常,歷時超過15個半小時。
阿里雲承認,此次香港Region可用區C服務中斷事件,對很多客戶的業務產生重大影響,也是阿里雲運營十多年來持續時間最長的一次大規模故障。並向所有受到故障影響的客戶公開致歉,稱將盡快處理賠償事宜。阿里雲表示,將盡一切努力從此次事件中吸取經驗教訓,持續提升雲服務的穩定性。
不過話說回來,阿里雲當機了,就跟特斯拉自燃了一樣,大家依舊會用阿里雲。但這次事件對阿里雲來說是一次大危機,一秒上億的交易量竟然能當機這麼久,要修15個小時?難以想象是做了十幾年的雲服務廠商。不過話說回來,運維人員一定演練過各種疑難雜症,技術方面肯定沒得說,但誰曾想到,伺服器竟然是以這種形式損壞了。
另外還想說一點阿里雲出了這種問題,它不是第一時間處理問題,而是去到處投訴侵權,有幾個相關的報導文章就被阿里雲投訴說侵害了他們的名譽權,要求立刻刪除文章。
文章來源:盧鬆鬆部落格,歡迎關注我的賬號哦!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69979355/viewspace-2929447/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 史上最快、最強大的 Gradle 5.0 釋出,新特性全解!Gradle
- 阿里雲凌晨大規模當機,華北部分網站陷入癱瘓阿里網站
- Apache RocketMQ 在阿里雲大規模商業化實踐之路ApacheMQ阿里
- 阿里大規模資料中心的效能分析阿里
- 史上第一次大規模AI抗疫AI
- Gmail全球大規模當機AI
- 20 年沉浮,《模擬人生》 如何成為了史上最成功的遊戲 IP?遊戲
- 微軟大規模更新了Edge瀏覽器內建的斷網小遊戲微軟瀏覽器遊戲
- 用更雲原生的方式做診斷|大規模 K8s 叢集診斷利器深度解析K8S
- 100PB!網際網路史上最大規模資料遷移之一:115科技遷至阿里雲阿里
- 史上最通俗分散式鎖解讀分散式
- Jenkins安裝配置,專案釋出、管理詳解,史上最清晰,值得收藏!Jenkins
- 北京大學郭煒-最長上升子序列 動態規劃講解動態規劃
- 史上最汙技術解讀,老司機瞬間開車!
- 雲端計算規模大嗎?可靠嗎?
- 阿里雲常用產品彙總及解釋阿里
- 史上最詳細的一線大廠Mysql面試題詳解MySql面試題
- 最IN的雲原生架構,阿里雲 Serverless 事件匯流排 EventBridge 重磅釋出架構阿里Server事件
- 最懂工業的大模型來了!思謀釋出全球首個工業多模態大模型大模型
- 阿里雲:阿里城市大腦解決方案(附下載)阿里
- 阿里雲聯合中國信通院釋出《雲端計算開放應用架構》標準,加速雲原生應用規模化落地程式阿里應用架構
- 史上最清晰的「歸併排序」講解排序
- 阿里雲專有宿主機(商業化)釋出阿里
- 任務全鏈路診斷助雲音樂大規模計算資源最佳化
- 中國科學院團隊釋出GeneCompass:解析基因調控密碼,打造乾溼融合新正規化密碼
- python中yield的用法詳解——最簡單,最清晰的解釋Python
- 可能是史上最詳盡的 QEM 網格簡化演算法解釋演算法
- 阿里雲資料庫PostgreSQL 13大版本重磅釋出阿里資料庫SQL
- 免費下載來自阿里巴巴 雙11 的《雲原生大規模應用落地指南》阿里
- 阿里雲慢下來了?阿里
- 【打理生活】廚房的疑難雜症之二:乾溼分割槽
- 誰開發了「史上最爛」的電子遊戲?遊戲
- Serverless 如何落地?揭秘阿里核心業務大規模落地實現Server阿里
- 獨家揭祕!阿里大規模資料中心的效能分析阿里
- 阿里雲Ansible 模組文件阿里
- 史上最輕量!阿里新型單元測試 Mock 工具開源阿里Mock
- 史上最大規模機器人“面相”調查:157張臉背後的人類感受機器人
- GitHub開源史上最大規模中文知識圖譜Github