資料中心火災防護刻不容緩,巴黎聖母院大火就是例子!

融為IT科技發表於2019-04-24

最近這段時間真的是一個多事之秋,前有“996事件”,後有巴黎聖母院大火,眾多熱點話題打破了這個本應平凡的四月。說到巴黎聖母院大火,我們不禁對人類文明逐漸崩壞而感到惋惜不已,果然在災害到來之際,人類的力量還是無法好好哪些守護龐大由珍貴的藝術結晶。

巴黎聖母院大火

在此次事故中我們可以明顯的感覺到,火災問題不容小覷。在每年,全球因意外而引發的火災數不勝數,其中資料中心機房也是名副其實的火災重災區。對於資料中心來說,最基礎卻最重要的東西就是IT運維,所有人都希望在自己的工作當中作出成績,在公司獲得地位和利益,但是作為資料中心的運維團隊來說,這卻也是最難的。因為這是一份隱藏在後臺的工作,他們的工作鮮有人注意,甚至外行都不知道他們的存在。但如果沒有他們兢兢業業的工作,不知道有多少資料中心將會變成付之一炬的巴黎聖母院,而由此帶來的現實經濟和業務損失,甚至要遠甚於後者。

對於一個佔地動輒幾萬平米的資料中心來說,相關裝置的巡檢、檢修、維護等都必須在保證效率的同時,把業務的影響降低到最小。現在新技術的發展可謂是日新月異,系統的複雜程度也越來越高。這就使得資料中心對系統執行安全,效率的要求也更為苛刻。一旦出現絲毫紕漏,輕則影響業務,重則造成社會和經濟的重大損失。

三星資料中心火災

上圖是2014年,三星韓國果川資料中心發生火災的現場照片。不知道如今還有多少人記得?萬幸的是當時這場大火沒有人員傷亡,但由於火災導致的當機,還是使得許多使用者的三星手機、平板電腦或智慧電視收到了無法提供服務的訊息。事實上,不光國外,在中國每年也有很多因為人為疏漏造成的資料中心火災。

一般人總認為資料中心都配有完善的消防器材、設施,並備有溫感、煙感等報警器。如果遇到火災隱患,會在第一時間被發現並處理。但其實這種想法是非常錯誤的,因為一旦資料中心失火,往往意味著事發地點的所有裝置都要受到牽連,後面的影響將是巨大的。

資料中心火災的主要特點是:散熱困難、煙氣量大、用電量大、電氣火災居多、火災損失大、撲救難度大、節點易燃燒。在資料機房發生的各類事故中,火災事故約佔80%左右。主要包括電子計算機本身起火;配套裝置或附屬裝置起火;空調裝置或電氣裝置起火;外來火災侵擾等。

據日本計算機制造商對使用者所作的調查表明,資料中心火災的起因,計算機故障佔3.4%;交換器與配電箱故障佔6.9%;裝置裝配錯誤佔10.2%;調節器故障佔10.3%;火焰蔓延引起的第二次火災佔17.1%;與計算機無關的其他原因造成的火災佔52.1%。

上述這些和資料中心著火有關的節點,都是運維人員要直接面對的,最簡單,也最枯燥的重複性工作。就好比這次的巴黎聖母院,據說是因為維修時候保險絲短路?多麼低階的一個問題,就讓一向以嚴謹著稱的法國人丟了臉面。

再度回到資料中心機房上來,這裡主要服務的物件是IT系統。雖然資料中心的生命週期長達十幾年,甚至幾十年。但是其中IT系統的變革卻日新月異,而且每一次的變革,都會要求運維人員必須接受新的,更為嚴格的培訓。他們必須隨時瞭解業界最新的動態、技術。並應用這些技術處理問題,以減小風險。還是以最基礎的IT裝置上架為例,運維人員必須要提前檢查騰空的容量,夏季必須關注通風和冷凝系統,防止高壓報警燈。冬季則要重點關注空調加溼系統,防止相關故障報警。雖然現在的綠色技術層出不窮,甚至前段時間阿里資料中心還用機器人替代了30%的人工重複勞動,但這並不意味著基礎運維可以懈怠了。

作為最基礎,最容易被忽視,卻又無比關鍵的運維崗位首先必須要注意,建立完善的巡查和維護、保養、應急處理等機制。其次,採用與時俱進的動環監控、報警系統。以減少誤報、漏報的發生。最後,將相關人員的責任心、行動力作為基石。畢竟,如果沒有高度負責的運維人員,一切都是空談。

本文轉載自

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31560271/viewspace-2642410/,如需轉載,請註明出處,否則將追究法律責任。

相關文章