作者介紹
熊亞軍,目前在百度負責 IT (網路、伺服器)裝置監控平臺研發。
主題簡介
本文將主要從以下幾個部分同大家探討:
1.多資料中心的特點及計費模式
2.資料中心的外網流量特點
3.外網流量最佳化的困難和挑戰
4.如何更充分利用付費頻寬
5.未來展望思考
一、多資料中心的特點及計費模式
背景:隨著網際網路業務的快速發展,大型網際網路公司資料中心的數量和網路複雜程度也在急速上升。
多資料中心的網路
和Google 的網路類似,大型網際網路企業的網路一般可以分為:
◆資料中心內部網路(Data Center Networks)
◆WAN網(即Wide Area Networks)
其中, 按照流量的方向,可將WAN網分為兩張骨幹網:
◆內網:資料中心之間互聯的網路(Inter-DC WAN,類似Google B4),用來連線網際網路企業在地理上分佈的多個資料中心。
◆外網:面向Internet使用者訪問的網路(Internet-Facing WAN),用來提供面向使用者的雲服務,如搜尋、影片、下載。
頻寬的計費模式
網際網路企業的外網(Internet-Facing WAN)需要向運營商支付高額的費用。
並且,隨著雲服務的蓬勃發展,Internet使用者數量和流量的急劇增加,網路容量也從數年前的10G快速增長到1T,10T甚至更大。
在資料中心的成本中,外網的頻寬費用越來越引起關注。其中,常見的外網計費模式有以下幾個:
1.峰值計費:對資料中心出口的頻寬週期(如5分鐘)取樣,按照一個月的最大頻寬取樣值進行計費。大多數資料中心都採用峰值計費的收費模式。
2.95計費:同樣進行週期取樣,去掉最大5%的取樣點,按照剩下的最大頻寬取樣值進行計費。
3.日均峰值計費:同樣進行週期取樣,每天有一個頻寬峰值,按照一個月內每天的頻寬峰值的均值進行計費。
二、資料中心的外網流量特點
一個簡單的峰值計費例子
峰值計費模式下,根據資料中心一個月的出口頻寬峰值進行收費。
如下圖所示,為某網際網路公司資料中心的流量圖,這個資料中心在第一天的夜裡22點到達峰值,依據該點的頻寬峰值進行計費。
很顯然,在非峰值時刻,該資料中心可以(免費的)使用更多流量。
如下圖的綠色部分,我們將資料中心能免費使用的流量稱為該資料中心的空閒頻寬。
在峰值計費的收費模式下,每個資料中心都有可觀的空閒頻寬,而這些頻寬並沒有被充分的利用起來。
特別的,某些特殊的日子會導致非常高的流量峰值,如京東618、雙十一或某部熱門劇集釋出。
資料中心在這個月其它時間的頻寬值都遠遠小於流量峰值,存在大量空閒頻寬。
一個日均峰值計費例子
有些資料中心採用日均峰值計費的模式。
和峰值計費類似,日均峰值的資料中心也有大量空閒頻寬沒有被充分利用起來。
如下某網際網路公司資料中心的流量圖中,非當日峰值的時刻,這個資料中心的流量遠小於當日的峰值,也存在非常可觀的空閒頻寬。