突發!!!!阿里雲新加坡資料中心突發火災,新加坡可用區C機房火災,故障處理進展

东白随记發表於2024-09-12

進展更新】今日凌晨,大部分受到網路影響的雲產品已恢復正常服務。剩餘斷電的機房業務仍需等待物理條件的恢復。20:23,消防部門仍在處理大樓現場風險中,運維工程師正在等待獲准進入機房大樓。如現場評估後不具備原地恢復的物理條件,應急小組將執行伺服器裝置遷移恢復預案。

【進展更新】01:46,接當地消防要求,因消防澆水持續進行,機房開始出現積水和滲漏,電路存在短路風險,新加坡可用區C 一棟機房大樓整體緊急斷電,可用區C其他大樓業務網路已陸續恢復。

【進展更新】截至20:04,目前火警仍未完全解除,受消防安全控制影響,運維工程師無法進入當地機房大樓,包間溫度持續升高風險暫無法解除。目前機房部分網路裝置在高溫環境下已出現異常,影響部分雲產品的網路互通。若後續溫升未得到有效控制,新加坡可用區C整體脫網的可能性在增加。若您的業務部署在新加坡可用區C,我們將協助您儘快進行業務遷移。

【進展更新】14:40 受影響機房包間的火情已經基本得到控制,機房溫度仍高。部分OSS物件儲存、資料庫等產品的單AZ版本,需待受影響物理機櫃具備重新開機條件後恢復。其餘高可用版本的雲產品均已完成主動遷移。

【進展更新】截至12:15 按照產品排程策略,雲原生大資料計算服務MaxCompute 已完成容災切換。

【進展更新】截至11:30 按照產品排程策略,雲資料庫Redis/MongoDB/RDS MySQL、物件儲存OSS、表格儲存OTS等雲產品的高可用版本已陸續完成容災切換。

【進展更新】 異常因新加坡機房鋰電池爆炸導致火災及升溫,消防人員已到達現場處置中,雲網路大部分產品及雲安全產品於10:55 已完成主動切換,其他雲產品服務仍在處理中。請您儘快遷移業務。

尊敬的客戶:您好!北京時間2024年09月10日10:20,阿里雲監控發現新加坡地域可用區C 網路訪問出現異常,部分雲產品服務出現異常,阿里雲工程師正在緊急處理中。若有任何問題,請隨時聯絡我們。

轉自東白隨記部落格,轉載請標明來源,謝謝。

相關文章