百度:如何最佳化多資料中心的頻寬成本?

佚名發表於2015-12-02

網站最佳化 百度資料中心 百度資料中心最佳化

作者介紹

熊亞軍,目前在百度負責 IT (網路、伺服器)裝置監控平臺研發。

主題簡介

本文將主要從以下幾個部分同大家探討:

1.多資料中心的特點及計費模式

2.資料中心的外網流量特點

3.外網流量最佳化的困難和挑戰

4.如何更充分利用付費頻寬

5.未來展望思考

一、多資料中心的特點及計費模式

背景:隨著網際網路業務的快速發展,大型網際網路公司資料中心的數量和網路複雜程度也在急速上升。

多資料中心的網路

和Google 的網路類似,大型網際網路企業的網路一般可以分為:

◆資料中心內部網路(Data Center Networks)

◆WAN網(即Wide Area Networks)

其中, 按照流量的方向,可將WAN網分為兩張骨幹網:

◆內網:資料中心之間互聯的網路(Inter-DC WAN,類似Google B4),用來連線網際網路企業在地理上分佈的多個資料中心。

◆外網:面向Internet使用者訪問的網路(Internet-Facing WAN),用來提供面向使用者的雲服務,如搜尋、影片、下載。

頻寬的計費模式

網際網路企業的外網(Internet-Facing WAN)需要向運營商支付高額的費用。

並且,隨著雲服務的蓬勃發展,Internet使用者數量和流量的急劇增加,網路容量也從數年前的10G快速增長到1T,10T甚至更大。

在資料中心的成本中,外網的頻寬費用越來越引起關注。其中,常見的外網計費模式有以下幾個:

1.峰值計費:對資料中心出口的頻寬週期(如5分鐘)取樣,按照一個月的最大頻寬取樣值進行計費。大多數資料中心都採用峰值計費的收費模式。

2.95計費:同樣進行週期取樣,去掉最大5%的取樣點,按照剩下的最大頻寬取樣值進行計費。

3.日均峰值計費:同樣進行週期取樣,每天有一個頻寬峰值,按照一個月內每天的頻寬峰值的均值進行計費。

二、資料中心的外網流量特點

一個簡單的峰值計費例子

峰值計費模式下,根據資料中心一個月的出口頻寬峰值進行收費。

如下圖所示,為某網際網路公司資料中心的流量圖,這個資料中心在第一天的夜裡22點到達峰值,依據該點的頻寬峰值進行計費。

網站最佳化 百度資料中心 百度資料中心最佳化

很顯然,在非峰值時刻,該資料中心可以(免費的)使用更多流量。

如下圖的綠色部分,我們將資料中心能免費使用的流量稱為該資料中心的空閒頻寬。

在峰值計費的收費模式下,每個資料中心都有可觀的空閒頻寬,而這些頻寬並沒有被充分的利用起來。

網站最佳化 百度資料中心 百度資料中心最佳化

特別的,某些特殊的日子會導致非常高的流量峰值,如京東618、雙十一或某部熱門劇集釋出。

資料中心在這個月其它時間的頻寬值都遠遠小於流量峰值,存在大量空閒頻寬。

一個日均峰值計費例子

有些資料中心採用日均峰值計費的模式。

和峰值計費類似,日均峰值的資料中心也有大量空閒頻寬沒有被充分利用起來。

如下某網際網路公司資料中心的流量圖中,非當日峰值的時刻,這個資料中心的流量遠小於當日的峰值,也存在非常可觀的空閒頻寬。

網站最佳化 百度資料中心 百度資料中心最佳化

相關文章