圖文細說Google資料中心

黃利民發表於2010-08-19

2010年7月20日,Google能源部向NextEra能源公司購買1.14億瓦的風力電能,以供部分資料中心在未來20年使用。NextEra已從7月30日開始向Google供電。

Google資料中心一直是業界中令人著迷的“物件”之一。那麼Google到底有多少資料中心?它們分佈在什麼地方?伯樂線上部落格的這篇文章整理收集一些有趣資訊,以供分享和參考。

Google資料中心分佈圖

Google 搜尋速度為什麼能這麼快?這主要因為Google在全球分佈著眾多的資料中心。根據現有資訊,如果包括在建的資料中心,Google共有36個資料中心。其中美國有19個、歐洲12個、俄羅斯1個、南美1個和亞洲3個(北京-Google.cn、香港-Google.com.hk和東京各1個)。不過,Google也並非完全獨享這些資料中心,他們也向其他公司出租空間。


圖1:Google資料中心-全球


圖 2:Google資料中心-北美


圖3:Google資料中心-歐洲

Google的第一個“資料中心”


圖4:Google的第一個“資料中心”–BackRub

Google 的首個“資料中心”是在佩恩的宿舍樓。一句話概括:麻雀雖小,五臟俱全。詳細配置請看《成名之前的Google:史丹佛大學期間的Backrub原貌

資料中心的伺服器

大部分公司都是向Dell、HP、IBM和SUN廠商直接購買伺服器。購買伺服器需要一大筆費用,如果 Google的伺服器均從其他公司購買,估計Google也無法有今天。時至今日,Google的所有伺服器均為自己一手打造。Google伺服器厚度 3.5寸,2U(兩機櫃式),它有2個CPU、2個硬碟,採用技嘉主機板,有8個記憶體插槽。Google採用AMD與英特爾的x86處理器。在同樣大的空間 內,Google的伺服器比其他廠商的伺服器能容納更多的CPU。


圖5-1:Google伺服器


圖5-2:“世紀互聯”機房中谷歌的一組伺服器(DELL Precision 390 工作站)

資料中心以集裝箱為單位,每個集裝箱裡面有1160臺伺服器,每個資料 中心有眾多集裝箱。

 

資料中心的核心技術

Google一直都鍾情於開源軟體,也一直支援開源技術 (Google對手之一的Facebook也同樣重視開源技術)。Google伺服器使用的是Linux作業系統。Google的工程師按照平行計算的要 求對Linux進行了優化。Google開發自有核心軟體,開發語言是Java和C++。

Google的三大核心元素:

0. Google 檔案系統(GFS);(GFS負責伺服器資料儲存工作)

1. Google大表;Bigtable:是Google一種對於半結構化資料進行 分佈儲存與訪問的介面或服務);由於Google的檔案系統異常龐大,以至於甲骨文和IBM公司的商業資料庫在方面無用武之地。另外,商業資料庫都是按 CPU數量來收費,如果Google使用商業資料庫,可想而知,這是一筆天文數字。所以,Google量體裁衣地設計了符合自身的大表。

2. Mapreduce 演算法;它是Google開發的C++程式設計工具,用於大於1TB資料的大規模資料集並行運算。MapReduce能夠找出一個詞語在Google搜尋目錄中 出現的次數;一系列網頁中特定詞語出現的頻率;連結到某個特定網站的所有網站數量等。

雖然Google依靠許多開源專案實現了企業的騰飛,但Google始終對這三大核心元素保密。

 

資料中心的專利

1. 伺服器內建電池。 每臺伺服器都有一顆12伏特電,確保萬一主斷源斷電時還可持續供電。最終目的,節約成本。

2. 可移動的資料中心集裝箱。2008年10月獲得該項專利,每個集裝箱中最多可容納1160臺伺服器。

 

資料中心的開銷

根據Google的盈利報告,2006年Google在資料中心上的開銷是19億美元,2007年是24 億,2008年23.6億,2009年8億9百萬,2010年上半年已開銷7億1千5百萬。


圖7:Google資料中心“燒錢”曲線圖

資料中心的選址標準

1. 大量的廉價電力;

2. 綠色能源,更注重可再生能源;

3. 靠近河流或湖泊;(裝置冷卻需要大量水源)

4. 用地廣闊;(隱祕性和安全性)

5. 和其他資料中心的距離;(資料中心之間的快速連結)

6. 稅收優惠。


圖8:Google的伺服器(左)Google俄勒岡州Dalles資料中心(中)Google 伺服器機櫃特寫(右)

Google的特殊資料中心——聖吉蘭資料中心

Google在比利時的聖吉蘭(Saint Ghislain)資料中心(圖3中編號26)根本沒有冷卻裝置,完全依靠純自然冷卻(即:用資料中心外面的新鮮空氣來支援冷卻系統)。一般來說,絕大部分資料中心都是採用水冷卻裝置。(這也就是為什麼資料中心選址時要考慮水源。)


圖9:Google比利時資料中心


圖10:比利時國王(左五)參觀Google比利時資料中心

Google的Dalles(達爾斯)資料中心

Dalles資料中心(圖2中編號8)位於俄勒岡州的波特蘭以東約80英里,旁邊是哥倫比亞河,河上有座大壩——Dalles大壩,大壩為資料中心提供便宜的電力。資料中心有2座4層樓高的冷卻塔。(注:“Dalles”不是“Dallas”,Dallas達拉斯在德州。)


圖11:Dalles資料中心鳥瞰圖

以下這段話來自Nicholasg Carr,他曾經在2009年訪問Dalles資料中。藍色部分是關關的註釋。

 

Dalles資料中心有3個超大機房(在圖11中有4個白色建築,但只有3個是伺服器機房),每個機房有45個集裝箱,每個集裝箱可以放置1160臺伺服器,故Dalles資料中心可以存放約15萬臺伺服器。

Google的祕密

Google在其資料中心的位置和數量方面的保密工作做得很好。比如說:如果你反查Google各種爬蟲或者是Google各個域名的IP地址,所得結果幾乎看起來都是加州山景城的IP地址。因此,想通過反查IP地址,基本無法推斷出其資料中心的真正位置和真正數量。

此外,Google通常把其資料中心“偽裝”成有限責任公司, 表明上看起來和Google毫無瓜葛。比如:北卡羅來納州Lapis公司和愛荷華州的Tetra公司。

既然Google在其資料中心方面的保密工作做得很出色,所以本文的資訊未必是百分百正確。

其他相關舊聞

2008年1月28日有報導稱,Google將在TW建立一資料中心。TW經濟負責人陳瑞隆已確認此訊息,並且表示已在TW西部彰化的彰濱工業區內為Google預算了一塊地。TW還將向 Google提供各種優待,包括土地稅折扣、保證電力供應穩定在內。不過至今一直沒有聽到這個資料中心在臺的任何動靜。

在陳瑞隆確認訊息 後的第二天,馬來西亞總理也宣佈,Google有意在馬來西亞建立資料中心。

另據報導,Google有意在東歐的立陶宛新建資料中心。

另外,Google曾於2007年在南卡羅來納州的布利西伍德購買466英畝(1英畝約合4000平方米)土地,似乎是打算建立南卡的第二個資料中心。

 

整理:伯樂線上

文章連結:http://blog.jobbole.com/173/

【非特殊說明,轉載必須在正文中標註並保留原文連結、譯文連結和譯者等資訊,謝謝合作!】

相關文章