Crane 釋出國內首個雲原生應用碳排放計算最佳化器

騰訊雲原生發表於2022-12-17

為了共同應對氣候變化挑戰,減緩全球變暖趨勢,2015年12月,近200個締約方共同透過了《巴黎協定》(The Paris Agreement),對2020年後全球如何應對氣候變化做出了行動安排。為實現這一目標,全球多個國家宣佈要實現碳中和。將中國、美國和歐盟比較,我國實現碳中和是一場時間緊、任務重、責任大的國家級戰略戰役。

全球氣候行動峰會發布的《指數氣候行動路線圖》顯示,數字科技在能源、製造業、農業、建築、交通等領域的解決方案,可以幫助全球減少15%的碳排放,是實現碳減排的關鍵技術因素。雲端計算平臺是資料中心基礎設施的“作業系統”,連線資料中心基礎設施和上層應用的紐帶和橋樑。如何在業務功能不受影響的情況下,提高整體的能耗比,使用更低的能耗,使計算、儲存、網路等資源滿足一樣的業務需求。提高整體的能耗比,降低PUE,成為資料中心節能的關鍵。透過在雲端計算平臺層面實施先進的技術和管理措施,能夠極大的提高雲端計算資料中心的能源利用率,促進降本增效,實現碳排放的顯著減少。

Crane 釋出國內首個雲原生應用碳排放計算最佳化器(Carbon Emission Optimizer)

為響應國家號召,助力雲原生應用節能減排,Crane推出了首個開源雲原生應用碳排放計算最佳化器。該計算最佳化器基於執行在Kubernetes平臺上的應用的實際資源消耗,計算對應伺服器功耗,進而計算出應用執行所產生的碳排放量。

該計算最佳化器核心能力包括:

能耗與碳排展示:

  • 根據工作負載的實際CPU利用率,以及執行業務的伺服器規格,計算支撐工作負載運轉所需功耗。
  • 根據國家定義釋出的碳排放因子,即每度電對應的碳排放量,計算工作負載運轉對應的碳排放量。
  • 除展示當前功耗和碳排放量以外,Crane同時提供最佳化建議,以及最佳化後的功耗和碳排放推算結果。

碳排放計算最佳化器

Crane根據工作負載實際資源利用率,提供了一系列工作負載成本最佳化能力:

  • Request推薦,給出Pod資源配置建議。
  • 副本數推薦,給出workload 副本數推薦。
  • 彈性推薦,給出HPA引數配置建議。

碳排放計算最佳化器對這些推薦能力做了增強,在給出最佳化建議的同時展示了採用這些建議以後可能的減排效果,讓使用者更直觀的看到最佳化動作對節能減排產生的積極作用。

Crane希望透過推出碳排放最佳化器來喚醒使用者環保意識,輔助有明確減排目標的企業針對雲原生應用量化不同工作負載的碳排放現狀和可最佳化空間,以及輔助企業理解碳排放現狀,制定顯示可行的減排戰略,並透過一站式最佳化手段達成減排目標。

Crane提供了面向雲原生技術棧的雲成本最佳化解決方案,並且雲原生的核心特性是面向應用的。那麼如何針對應用進行碳排放測算並給出最佳化建議呢?下文給出詳細計算方法。

節點利用率與碳排放是相關的

基於工作負載利用率計算功耗

不同CPU型號,不同伺服器在空閒和滿載時的功率均有不同。伺服器廠商通常會定期將伺服器功耗資訊提交至標準效能評估組織(如:https://www.spec.org/),並交由該組織公開資料。
伺服器的功耗通常包含最低功耗和最高功耗,最低功耗代表CPU利用率為0%時,該伺服器開機以後維持基本運轉時的功耗;最高功耗代表CPU利用率100%時,也就是CPU滿負荷運轉時的功耗。不同伺服器的功耗差異主要是因為CPU架構、型號和數量不同導致的,下表展示了幾款典型伺服器的功耗資訊。

提供商伺服器型號處理器總核數平均最低功耗(Watts)平均最高功耗(Watts)
Inspur CorporationInspur i24LM6Intel Xeon Platinum 8368Q76348769
LTechKorea, Inc.LKG-2212-CIntel(R) Xeon(R) Gold 6226R3296.6377
Lenovo Global TechnologyThinkSystem SN550 V2Intel Xeon Platinum 8352M8962,1155,637

既然伺服器功耗與CPU利用率直接相關,那麼針對任何業務,就可以透過如下公式將工作負載的CPU利用率轉換成為功耗:
Average Watts = Min Watts + Avg vCPU Utilization * (Max Watts - Min Watts)
其中引數解釋如下:

  • Max Watts: 伺服器利用率為100%時,單個vCPU的功耗。
    最大功耗整機最高功耗(物理核數核超執行緒數)最大功耗=整機最高功耗/(物理核數∗核超執行緒數)
  • Min Watts:伺服器利用率為0時,單個vCPU的功耗。
    最小功耗整機最低功耗(物理核數單核超執行緒數)最小功耗=整機最低功耗/(物理核數∗單核超執行緒數)
  • Avg vCPU Utilization:平均vCPU利用率,如CPU用量為200%代表使用了2個vCPU

因此要衡量一個業務的功耗,我們只需查詢該業務執行的伺服器型號,並根據業務的CPU利用率,便可以將業務的CPU開銷轉換成對應利用率的功耗。··
但侷限於現實情況,我們可能無法實時得知具體工作負載所對應的伺服器型號。譬如:雲廠商沒有提供用於查詢伺服器功耗的API介面;工作負載執行在虛擬機器上,而vCPU因雲伺服器的規格而被限制。
為了可在無法獲知具體伺服器型號資料時,儘可能地規避資料不精準而帶來的誤差,我們可以基於不同雲廠商公開的所有伺服器型號,每核時的平均功耗。基於平均功耗,即可在不獲取伺服器型號資料的前提下,估算工作負載的功耗,如下表:

雲提供商Average Min WattsAverage Max Watts
AWS0.743.5
GCP0.714.26
Azure0.783.76
均值0.7433.84

基於功耗計算碳排放

在有了功耗資訊以後,如何再將功耗轉換為碳排放量?中國生態環境部2022年釋出的《電力行業溫室氣體核算指南修訂版》中明確提出,電網排放因子採用0.5810tCO2/MWh,並且將根據生態環境部發布的最新數值適時更新。區域因子在新版指南中去掉了,因此無論所處地域,未來國內碳排放測算都使用統一排放因子。
工作負載的碳排放最終計算公式為:
AverageCarbonEmissions=AverageWatts∗EmissionFactor=AverageWatts∗0.5810

用Crane碳排放最佳化器保護地球

就資料中心的容量而言,IT 裝置的利用率通常十分低。伺服器的利用率只有 5-15%,處理器利用率為 10- 20%,儲存裝置利用率為 20-40%,網路裝置利用率為 60-80%。 但即使任何此類裝置空閒,裝置仍然消耗大部分電能。一臺標準伺服器即使是在完全沒有工作的情況下也會消耗 30-40%的最大功率(閒置瓦數:200W+)。
要降低碳排放量的核心方案,除了為資料中心更換清潔能源,另一個便是將單機的資源利用率提高、提高單機能耗比。而Crane碳排放最佳化器恰恰可以將單機的資源利用率提高、提高單機能耗比。

所以此處對Crane碳排放計算最佳化器進行總結:
1.Crane能力的另一個維度的展示,將從節點維度入手,專注於能耗、碳排放的展示以及指導使用者如何去做資源最佳化。
2.可基於Crane的能力對擁有碳排放指標的資料中心進行最佳化,合理提高單機的工作負載佔比,降低整體能耗,從而達到低耗低排低碳的效果;可結合自建IaaS平臺的能力,動態休眠物理伺服器,從而最佳化物理伺服器的線上數量,降低資料中心的電費開銷、減少碳排放。
3.透過Crane的Recommendation能力,對工作負載進行副本數、資源分析,推薦恰當的副本數、資源配置,從而有效地改善資源浪費問題,提供整體能耗比。

【騰訊雲原生】雲說新品、雲研新術、雲遊新活、雲賞資訊,掃碼關注同名公眾號,及時獲取更多幹貨!!

相關文章