關於資料中心能源管理,企業需要重視的因素有哪些?

IT老王部落格發表於2018-06-26

資料中心的能源管理對於現如今的任何企業組織都至關重要。當前,企業資料中心的能源管理亟待採取多管齊下的方法,並充分考慮各種相關事項和因素。那麼,在對於貴公司資料中心的能源消耗實施管理的過程中,究竟哪些因素是您企業尤為需要重視的呢?

在本文中,來自業內相關專家們的建議是:檢查貴公司資料中心當前伺服器機架的最佳密度的變化情況,幫助您評估貴公司資料中心是否需要在伺服器更新後部署成本昂貴的冷卻方案升級,以及如何使伺服器機架密度與冷卻方案保持一致。此外,文章中,我們還將為您介紹當前資料中心能源市場的進展情況。

資料中心能源管理領域正在發生的相關變化?

智慧化PDU和DCIM的普及開啟了全新的資料中心能源管理,但這是短期的。而一套強有力的能源管理戰略則將有助於長遠的激勵資料中心的高效節能。

新的裝置,工具和業務戰略將有助於企業控制IT能耗成本,而這正是企業資料中心最大的運營成本之一。

當前,企業資料中心的能源管理需要採取多管齊下的方法,這包括:優化的電力供應硬體、能夠清晰描繪能源使用情況的相關工具、暴露相關變化即將取而代之的領域,以及能夠帶來最佳投資回報(ROI)的恰當的能源控制產品的業務戰略。

企業資料中心在缺乏相關能源使用基準的情況下,也就無法確定其能源效率。在全球範圍內,根據建築物電錶測量的用電量所進行的能源效率的估算,足以用於評估企業資料中心整體的能耗情況,如電源使用效率(PUE)。但這並不能確定具體系統的能耗效率。例如,一處資料中心的PUE值為1.2,表明該資料中心達到了出色的能效,因為幾乎所有進入該資料中心建築物的電力資源都被資料中心使用了。但是,如果該資料中心有50%的伺服器處於已啟動的閒置狀態,則該PUE值並不能顯示該資料中心產生了大量的能源浪費。

1、資料中心裝置的變化

今天的企業級低功耗伺服器所鼓吹的處理器效能(P-狀態)和執行狀態(C-狀態)幾乎關閉了閒置處理器核心。IBM公司的System x、戴爾的第12代PowerEdge和其他伺服器使用熱控制,例如由轉速計監控的變速冷卻風扇、系統內的多個溫度測量位置、甚至持續的電源監控,以計算和報告相容工具的使用情況。

配電單元(PDU)使用智慧化來幫助企業組織瞭解其資料中心的能源使用情況。諸如來自APC公司的Switched Rack AP8000系列產品和CyberPower公司的監控裝置等網路化的PDU能夠提供實時功率監測和溫度/溼度感測功能。這些裝置還可以控制插座級別的功率,以實現裝置(如個別機架伺服器)的細粒度迴圈。智慧PDU裝置通過大量需要精確監測和控制的機架裝置;並通過管理工具處理PDU資料,以分析和報告機架中的電力使用和環境條件,來使得資料中心獲益。

不間斷電源(UPS)系統可使資料中心裝置在發生公用供電故障期間繼續保持執行,從而提高能源效率和智慧。對於擁有廣泛資料中心的大型企業而言,可擴充套件的UPS系統(如艾默生網路能源公司的Liebert NX On-Line 225-600 kVA或通用電氣公司的冗餘並行架構產品)代表了兩種新興的方法,其中電池容量隨著工作負載的增加而逐漸增加——UPS系統可以平行安排以支援擴充套件的工作負載。將電池數量與工作負載相匹配,可以減少浪費在為額外電池充電時的能耗。

企業資料中心也在重新審視能源管理的備用或生態模式概念。並非採用交流-直流-交流這一效率較低的雙重轉換模式,而是在公用供電出現故障後,將在毫秒之間切換到採用UPS供電。現代UPS系統能夠還向監控和管理軟體報告準備情況,電池狀態,工作負載和其他執行狀況。

2、DCIM的變化

資料中心能源管理產品已經發展成為資料中心基礎設施管理(DCIM)的一大類別——這類軟體能夠提供從資料中心設施到伺服器再到裝置級別的細化的報告。

DCIM所提供的不僅僅是能源監控。由於IT裝置能夠傳遞狀態和效能資訊,DCIM工具可幫助企業的IT專業人員進行容量規劃,系統庫存控制和裝置生命週期管理,工作負載平衡和伺服器整合——包括關閉閒置伺服器,監視和改進系統彈性以及採取其他基於洞察分析的舉措。

DCIM軟體可以讓資料中心當前工作負載不需要的裝置閒置和關閉。還可以識別對於舊的耗電系統實施技術更新的時期是否已經成熟,或者是否可以替換為更加節能的模式,或者是否可以通過工作負載重新分配或整合,甚至遷移到託管雲來淘汰舊的耗電系統。DCIM工具還可以將資料中心的溫度和溼度水平與系統活動和能源使用情況相關聯,以便通知管理人員及時作出容量規劃的決策。

為了應對不規則的能源使用情況,當條件發生變化時,資料中心管理運營人員需要尋求諸如功率容量預測和容量建模等功能,併為使用計算的內部部門尋求能源退款計費。這些措施將允許企業估算新系統的功率、冷卻、空間和網路資源,或計算每款能源子系統的碳排放量。

對於DCIM工具的選擇並不關乎資料中心規模大小,而關乎到該軟體是否與貴公司資料中心當前和未來的裝置相相容,以及是否具備滿足您企業業務目標的功能集。雖然任何企業都可以採用DCIM,但在這方面進行部署所需的開銷往往會決定企業使用者是否使用全功能資料中心執行數百臺伺服器。規模較小的企業組織可以通過較小範圍的部署點解決方案工具來獲益。

同構資料中心具有特定伺服器的管理工具選項。例如,IBM公司的System x與IBM Systems Director合作進行電氣和熱量監測和控制,此外還能夠執行許多其他任務;而戴爾的PowerEdge產品組合使用OpenManage系統管理平臺具備硬體整合的戴爾遠端訪問控制器。而惠普的ProLiant Gen8伺服器、儲存和網路產品則與惠普Systems Insight Manager軟體組合。

許多第三方能源和基礎設施管理工具亦可滿足企業資料中心的需求,其中包括思科的EnergyWise套件,Raritan公司的Power IQ(該供應商的DCIM套件的一個元件),施耐德電氣的APC StruxureWare資料中心套件以及Nlyte Software公司的Nlyte 7.5 。

DCIM的大規模採用將推動技術的更新,從而通過新增更多符合DCIM的裝置和感測器來增強DCIM的功能。

3、長期的能源戰略

大多數企業組織可以在短期內依靠採用新的系統和軟體進行資料中心能源管理,但若是想要實現效率最大化,則需要制定一套長期的戰略和目標。

許多企業組織通過伺服器虛擬化來整合硬體,並可以達到更高的虛擬化百分比。通過讓一臺物理伺服器支援多個工作負載,企業可以減少物理伺服器的數量,並降低系統和散熱所需的能耗。但是,虛擬化的部署需要投資於諸如VMware vSphere和微軟Hyper-V等虛擬化管理程式以及特定的虛擬化IT專業知識。虛擬化技術對於資料中心節能和工作負載的移動性至關重要,但切記不要期望能夠在一夜之間就能夠有立竿見影的效果。

新興的能效策略是將工作負載重新分配給遠端公共雲服務或託管服務提供商。恰當的遷移減少了企業資料中心物理伺服器數量,並降低了能耗和散熱需求,但這一措施並非是針對企業全部工作負載的——關鍵任務、地理位置調節、高安全性需求或難以重新編碼/重新架構的工作負載務必請保留在企業自己的伺服器上。通過外包,每項技術的更新都意味著企業將購買更少量的新伺服器。大規模企業資料中心也可以由此節約可觀的能源賬單。

在大型資料中心設施中,若干基礎設施方面的改進將通過最大限度地減少公用設施與IT系統之間的電壓/電流轉換次數來提高能源效率。例如,一些企業的資料中心選擇使用更高的工作電壓,例如208伏交流電,而不是美國傳統的120伏交流電或更高的歐洲415伏/ 240伏電(400伏)標準。較高的工作電壓需要較少的降壓轉換。另一種方法則是使用一種統一的直流電源,根據開放標準(如Facebook的開放計算專案)專門設計的裝置。這允許實現交流電到直流電的轉換,並且消除了伺服器的許多個別電源。UPS系統可以將直流電從電池直接輸送到直流配電系統,從而消除了另一種轉換。但是,從交流電到直流電裝置的轉換需要徹底改裝伺服器和系統。

根據資料中心所處地理位置、季節、電力來源和需求的不同,資料中心能源成本差異很大,每千瓦時的成本從3美分至30美分不等。企業可以考慮從不同的電力供應商或區域性電場購買能源——例如資料中心所在當地的風力或太陽能發電場。在主機託管和託管方案中,服務提供商可以彙總電力成本,或者主機託管企業客戶可以在不同地點之間遷移工作負載以實現最佳電力交易。

沒有考慮採用備用發電機的電力戰略是不完整的。對於柴油發電機來說,其所涉及到的相關的費用、定期的測試、切換和維護,更不用說其所帶來的相應的汙染——進一步使得Bloom能源伺服器(Bloom Energy Server)等固體氧化物燃料電池發電機對未來的備用電源相當具有吸引力。燃料電池使用天然氣或各種可再生生物燃料來發電。對於大型資料中心而言,可以考慮將燃料電池發電機作為主電源,並將公用供電作為備用電源。

制定長遠的業務目標將有助於確定哪些長期戰略對您的資料中心最有意義。計算任何IT能源管理舉措的投資回報率,尤其是那些更具顛覆破壞性的舉措的投資回報。例如,如果一家公司計劃將其IT工作負載遷移到私有云提供商,則不要建立新的最先進的資料中心設施。如果您企業新的遠端資料中心設施計劃在短期內破土動工,那麼請不要部署8.6年才能實現ROI的本地Bloom能源伺服器。如果貴公司的IT團隊不考慮大規模實施伺服器虛擬化和整合專案的話,那麼長期的能源採購合同將不會節省資金。

更舊的機架冷卻技術是否能夠處理更高的伺服器密度?

並非每家企業資料中心都需要在伺服器更新後進行昂貴的冷卻升級方案。遵循本文接下來這些提示可確保使您企業的伺服器機架密度與冷卻方案保持一致。

為了獲得更好的效能,資料中心必須確保伺服器機架冷卻系統的冷卻能力與伺服器密度相匹配,反之亦然。

如果貴公司隨著時間的推移,追蹤記錄資料中心的能源使用情況,您會看到一條向上增長的鋸齒趨勢曲線。更高的計算需求意味著需要採用更多的伺服器,推動能源需求額上升,直到採用新一代更節能的伺服器,這會降低能源的使用量,直到更多的計算需求開始推動能源需求的再次上升。

那麼您企業是否正在更新一些伺服器,並想確切的知道伺服器機架的當前密度以及最佳的密度。伺服器機架密度是否已變化了?

目前,滿載伺服器機架的功率密度為8 kW至10 kW,刀片系統的功率範圍為12 kW至16 kW。老化的資料中心和伺服器機房可能難以降低這些機架密度,在這種情況下,您企業應該少執行一些滿載的機架,並計劃在未來採用新的冷卻基礎設施。

較之早期的大約每臺伺服器1千瓦或2千瓦功率的伺服器機架能量密度,現在的機架已經開始有所增加。這些伺服器通常是相對較大的(2U或4U)機櫃中的單處理器系統。伺服器技術發展迅速,多處理器和多核系統的組合,與系統元件的更高階別整合以及從本地磁碟到中央儲存區域網路或網路連線儲存的儲存轉移允許更小的1U機箱。這將平均機架密度推進到了5千瓦到7千瓦的範圍內,其中一些甚至高達10千瓦。

儘管隨著高密度刀片系統的推出,業界專家預測機架密度將達到20千瓦到25千瓦,但這些部署從未進入主流應用領域。這種機架密度所產生的熱點很難用計算機房空調和其他標準資料中心冷卻技術來實施冷卻。在更高的機架密度下,冷卻方案選擇包括直接冷卻,如液體冷卻方案和專用機架。

與前幾代相比,今天的伺服器在低能耗方面做了更多的工作。隨著處理器供應商投資於功能研發——較小尺寸的晶片製造、時鐘節制,降低了伺服器的功耗和散熱範圍,伺服器供應商正在將高度整合的片上系統平臺和其他節能技術構建成新的伺服器平臺。隨著計算容量的增長,散熱可以仍然保持不變。

虛擬化技術的採用對機架功率密度幾乎沒有影響。一臺裝滿虛擬化伺服器的機架可以執行比相同機架的非虛擬化伺服器多得多的工作負載,但是兩臺機架所消耗的用於執行伺服器的能量是相同的。對於相同的工作負載,虛擬化資料中心將需要更少的機架,從而降低整體能源需求。

如果貴公司沒有構建新的資料中心的預算,則需要依靠對資料中心進行合理的修整來支援您的技術升級計劃方案,從而保持當前系統和工作負載的運營完整性。

相關文章