阿里雲解釋史上最長大規模中斷:機房溼了
我是盧鬆鬆,點點上面的頭像,歡迎關注我哦!
據DNSAdmin爆料:阿里雲解釋了12月18日史上最長大規模中斷(15.5小時)的4大問題。12月25日,阿里雲官方釋出說明,詳細解釋了此次中斷故障的過程、原因,以及改進措施。
簡而言之就是:阿里雲冷機故障,引起了機房高溫,高溫觸發了消防噴淋,因為機器溼了,很多機器遇水損壞了,所以修了15個半小時。
據悉,阿里雲此次服務中斷源於水冷系統出現故障,且長時間無法恢復正常,導致機房溫度升高,現場處置不及時又導致觸發消防噴淋,部分硬體遇水損壞,另外客戶在香港地域新購ECS等管控操作失敗,長時間無法擴容。從當天早上8點56分首次檢測到故障警告,次日凌晨0點30分所有服務恢復正常,歷時超過15個半小時。
阿里雲承認,此次香港Region可用區C服務中斷事件,對很多客戶的業務產生重大影響,也是阿里雲運營十多年來持續時間最長的一次大規模故障。並向所有受到故障影響的客戶公開致歉,稱將盡快處理賠償事宜。阿里雲表示,將盡一切努力從此次事件中吸取經驗教訓,持續提升雲服務的穩定性。
不過話說回來,阿里雲當機了,就跟特斯拉自燃了一樣,大家依舊會用阿里雲。但這次事件對阿里雲來說是一次大危機,一秒上億的交易量竟然能當機這麼久,要修15個小時?難以想象是做了十幾年的雲服務廠商。不過話說回來,運維人員一定演練過各種疑難雜症,技術方面肯定沒得說,但誰曾想到,伺服器竟然是以這種形式損壞了。
另外還想說一點阿里雲出了這種問題,它不是第一時間處理問題,而是去到處投訴侵權,有幾個相關的報導文章就被阿里雲投訴說侵害了他們的名譽權,要求立刻刪除文章。
文章來源:盧鬆鬆部落格,歡迎關注我的賬號哦!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69979355/viewspace-2929447/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 史上最快、最強大的 Gradle 5.0 釋出,新特性全解!Gradle
- 史上開發時間最長的軟體Xanadu釋出
- Gmail全球大規模當機AI
- 微軟大規模更新了Edge瀏覽器內建的斷網小遊戲微軟瀏覽器遊戲
- 阿里雲凌晨大規模當機,華北部分網站陷入癱瘓阿里網站
- 史上第一次大規模AI抗疫AI
- 20 年沉浮,《模擬人生》 如何成為了史上最成功的遊戲 IP?遊戲
- 史上最詳細的一線大廠Mysql面試題詳解MySql面試題
- 最懂工業的大模型來了!思謀釋出全球首個工業多模態大模型大模型
- 史上最強程式碼註釋(不看後悔)
- 史上最通俗分散式鎖解讀分散式
- Apache RocketMQ 在阿里雲大規模商業化實踐之路ApacheMQ阿里
- 大規模知識庫中的隨機遊走推理和學習隨機
- 史上最詳細的webpack 講解2 (DefinePlugin中的淫技巧)WebPlugin
- 誰開發了「史上最爛」的電子遊戲?遊戲
- 英國政府開源了其大規模監控軟體
- 谷歌大腦神經機器翻譯大規模實驗:尋找最優的超引數組合谷歌
- 史上最清晰的「歸併排序」講解排序
- GitHub開源史上最大規模中文知識圖譜Github
- Jenkins安裝配置,專案釋出、管理詳解,史上最清晰,值得收藏!Jenkins
- 史上最大規模ACL大會放榜,百度10篇NLP論文被錄用
- 阿里雲效團隊大規模程式碼構建技術實踐阿里
- 史上最大規模機器人“面相”調查:157張臉背後的人類感受機器人
- 史上最奇葩的5種程式語言,有的甚至模擬奶牛
- python中yield的用法詳解——最簡單,最清晰的解釋Python
- 可能是史上最詳盡的 QEM 網格簡化演算法解釋演算法
- iPhone 6S大規模自動關機!蘋果:無統一解決方案iPhone蘋果
- 手機史上九大技術突破
- 史上最詳細的 webpack 講解 1 (vue-cli 中 build.js)WebVueUIJS
- MPP大規模並行處理架構詳解並行架構
- Palm公司擬大規模裁員 解決官僚問題
- 計算機史上最昂貴的域名Top 10計算機
- 資料中心機房建設標準規範
- 詳解動態規劃最長公共子序列--JavaScript實現動態規劃JavaScript
- 歷史上最偉大的12位程式設計師程式設計師
- 歷史上最偉大的 12 位程式設計師程式設計師
- IGN評分8.8!它是史上最長壽的RPG遊戲!遊戲
- 動態規劃:最長上升子序列動態規劃