英國航空公司正在進行其資料中心電力中斷的調查

知與誰同發表於2017-07-04

英國《泰晤士報》報導,由於主要資料中心供電問題,英國航空公司5月27日的航班受到嚴重影響,大約75000名乘客受到取消航班影響。據稱,這是由於承包商意外關閉資料中心電源造成的。由於影響到公司幾乎所有的IT系統,英國航空公司被迫在公眾假期週末期間取消從倫敦的希思羅機場和蓋特威克機場出發的所有航班。

英國航空公司(BA)表示正在進行“詳盡的調查”,以確定資料中心停電的根本原因。

正如行業媒體“計算機週刊”所報導,這個資料中心電力故障導致英國航空公司的入住,行李處理,預訂和聯絡中心繫統在5月27日當機,導致兩天內的兩個機場的大部分航班被取消。

英國航空公司發言人表示,該公司知道發生了什麼事情,但現在正在確定其事故原因。

該公司在宣告說:“由於不受控制的電力中斷,英國的資料中心遭受了巨大的損失,電源浪湧導致我們的IT系統當機。我們正在進行詳盡的調查,以瞭解具體情況,最重要的是要確保這種事情不能再次發生。”

在發生混亂的期間,航空專線小組工會就發表了自己的宣告,指責2016年英國航空公司決定將其部分IT功能外包給印度,這是發生中斷事件的一個因素。

英國航空公司的宣告駁回了專線小組的指責,表示決定外包只是為了滿足其資訊科技的要求,並不會造成中斷事件。

據《電訊報》報導,“IT當機並不是IT裝置的失效,與IT外包無關。這是一個電力供應中斷導致的事件。”讓人們對這種中斷有了更多的瞭解。並表明英國航空公司基於希思羅機場的兩個資料中心之一的故障可能來自不間斷電源(UPS)故障。

這個資料中心的電力最初在5月27日上午8時30分失效,如果UPS正常工作,電力應該被恢復。但是,正如英國航空公司的宣告中所證實的那樣,恰恰相反,沒有提供備用電源,使其伺服器發生了“災難性的物理傷害”。

行業媒體“計算機週刊”的資料中心技術和生態高效IT研究副總裁Andy Lawrence表示,大多數資料中心供電系統的設計就是為了應對這種電力中斷問題。他說:“電力系統中的一些系統顯然未能達到預期的水平。”

英國航空公司進行的調查即將結束。然而為什麼這麼多的航空公司的系統受到影響,Lawrence對此表示不解。

他說:“很顯然,英國航空公司一直在努力解決幾個問題,從電源開始,再擴充套件到網路/訊息系統,以及資料庫/應用程式設計。從所有這些問題中恢復,當他們跨越多個團隊並涉及多個承包商時,是具有挑戰性的。”

他說,從整體應用架構的轉變可能是一個因素。他表示,隨著時間的推移,這些系統也在不斷變化和發展,開發多個外部依賴關係的每個系統都在做出貢獻。所有這些都要求採用分散式彈性戰略,確保應用程式能夠充分應對部分故障和不完整的資料。”Lawrence說。

他表示,“同樣,資料中心冗餘備份和關鍵的相互關聯的系統可能需要在電氣和邏輯上彼此分離。如果它們在同一個資料中心執行,那麼這個資料中心規劃和執行方面需要得到良好的實施,以減少其中斷風險。”

本文轉自d1net(轉載)


相關文章