探秘Facebook的人工智慧大腦:Big Sur硬體系統

佚名發表於2016-07-15

  在俄勒岡州 Prineville 的山上一棟 350,000 平方英尺(32516.064 平方米)的大樓裡,嵌在一臺不起眼的伺服器機架狹縫裡面的是 Facebook 最有價值的人工智慧工具,它叫 Big Sur ,是一種訓練軟體不斷提升效能的硬體系統。它使用從全世界篩選而來的海量資料,並利用這棟大廈內部的超級計算能力將以前需要幾個月才能做完的事加速到只需要幾個小時就能完成。有了 Big Sur ,Facebook 能夠訓練啟動桌面遊戲播放程式和幫助軟體「解讀」圖片並向人們解釋圖片內容的人工智慧程式。

  Big Sur 系統可以在第二代 Facebook 的 Prineville 資料中心找到,第一代建成僅在六年前。 Prineville 是俄勒岡州中部的小城市,居民僅在 9,000以上。這座城以 Facebook 這家社交網路公司的第一家美國伺服器農場為標誌,這些伺服器被建造出來用於承納 Facebook 節節升高的使用者量和網站劇增的計算需求。現在,此園區包圍了 100 萬平方英尺土地,在 735 Connect 街上有將近六棟整體灰色大廈,從 126 大道向各個方向延伸。

  其運作方式看上去更像政府辦公大樓,而不是像資料中心,而且它的安保措施覆蓋了所有進出口。對於科技產業之外的人來說,他們很容易將 Big Sur 視為等同於機密檔案,存放在深處的建築群裡的封鎖的多層次的物理空間之中。

  

  在 Facebook Prineville 第二代的兩個資料操作中心內部;第三代資料中心正在構建中。

  真正的驚喜:第三代資料中心都確實不會被嚴格保密。事實上, Facebook 去年宣佈, Big Sur 在取代 Prineville 資料中心和全美國其它幾個地方的系統之前會成為一個開源專案。這家公司已經將 Big Sur 的設計提交給了開源計算專案 (Open Compute Project) 。由 Facebook2010 年開創的資料中心社群,其設計宗旨是讓硬體更高效節能,並分享公司及其競爭對手從全美國日益增長的伺服器群組中學到了什麼。

  透過使用 8 個現成的——儘管很昂貴的—— Nvidia 圖形處理器 (Nvidia GPUs ) 和生產商 Quanta 的設計參考書,你甚至可以自己動手建立初級版本的Big Sur ,就像 Facebook 做的那樣。但是,如果不像 Facebook 在 Prineville 將成千上萬的基於 GPUs 的系統繫結在一起,你就不可能獲得符合設計初衷的能夠進行人工智慧訓練的能力。建立真實可靠的 Big Sur 設施需要只有像谷歌或微軟這種大公司才願意投資的某些資源。(這兩家公司都參與開源計算專案,而且只要他們願意,他們就能建立 Big Sur 的類似版本。)

  「我們的職責不是保守秘密,」Kevin Lee 是 Facebook 技術專案經理,監管 Big Sur 和位於 Prineville 的其它伺服器設計,他說,「我們的目標是理解世界,是驅動人工智慧的發展。」當然,谷歌有它自己的訓練人工智慧的開源軟體,即 Tensor Flow ,所以 Facebook 出於與谷歌競爭的理由,也會繼續分享它的秘密。

  Lee 說,人工智慧是 Facebook 未來的三大核心支柱之一。其CEO Mark Zuckerberg 四月份在 F8 開發者大會勾勒了 Facebook 十年的戰略規劃圖,解釋了社交網站 Facebook.com 如何成為這樣的公司的第一步,而它的許多移動應用程式是第二步。接下來十年,Zuckerberg 想讓 Facebook 引領網路互連、無人機、擴增實境、虛擬現實和人工智慧行業。

  人工智慧正在幫助 Facebook 軟體看見和理解世界,解讀人類語言,獨自進行推理,並安排自己的行為過程。其中一些已經能實際操作了。例如, Facebook 的新款多語言編輯器(multilingual composer) 讓你以某種語言編排文字,然後自動翻譯成其它語言。另一個新鮮的例子是使用 Facebook 的人工智慧去分析圖片並向盲人和視覺受損的使用者描述圖片內容。每次你上傳圖片,訓練 Big Sur 的圖片識別演算法都會識別人臉並建議圖片中哪些人需要標記。

  這些特徵中,每個特徵的中心都是機器學習,一項幾乎和人工智慧本身一樣歷史悠久的人工智慧訓練技術。多虧了海量資料集的開放以及最近計算能力的飛躍,機器學習已經漸漸成為一種改善這類軟體日益有效的方法。和許多競爭者一樣,Facebook 使用機器學習訓練神經網路,機器學習是受人類大腦啟發可以繪製模式並且把機率結果從複雜資料集中摘出的演算法。

  Nvidia 公司加速計算部的副總裁 Ian Buck 與 Facebook 人工智慧與資料中心團隊有著密切合作,他說,「第一次培訓一個獨立的神經網路花費了我們整整三個月。」而在使用新型 Nvidia GPUs 最佳化培訓硬體後,培訓時間被縮短到了一個月。他還說有了配備最新 Nvidia 硬體的 Big Sur,現在不到一天就可以培訓一個神經網路執行以往需要人來完成的任務。

  

  Nvidia 公司的 Ian Buck 站在一架由 Big Sur培訓的神經網路旁,它正在基於 12,000 多幅畫作來創造藝術

  Buck 在低層級的 FacebookPrineville 資料中心深處實時展示這個場景。一個由 Big Sur 培訓過的 Facebook 人工智慧消耗數不勝數的看似是法國印象派畫家的畫作,並且開始自己作畫。他不使用虛擬畫架和筆刷,而是基於這些消耗的畫作設想出畫該是什麼樣子,然後創造出圖形檔案。Buck 說團隊給它提供了 12,000 幅左右的畫作,30 分鐘內它便開始輸出原創作品了。他補充說,還有一些培訓它的更精細的方法——告訴人工智慧更多地關注一幅比方說沒什麼雲彩的畫上,同時不太去關注那些畫著陰沉天空的作品。

  這還只是一個測試版本,Google Deep Dream 的神經網路同樣使用計算機視覺來建造超現實影像。但是 Facebook 的概念驗證暗示出它計劃讓人工智慧遠遠超出圖片標記和翻譯的範疇——Facebook 公司剛剛開始探索這些可能。

  Facebook 的作畫人工智慧暗示出它計劃超越圖片標記。

  現階段,Facebook 希望憑藉越來越強大的部件來改進 Big Sur。Lee 表示該系統為模組化,從而支援更新的 GPUs 以及不同的伺服器與機架設計。以它現在的狀態,Facebook 的資料科學家們和人工智慧研究者們能夠登陸位於 Prineville 的伺服器並且使用 Big Sur 培訓尚未被投入使用的離線演算法。

  

  Facebook 的 Kevin Lee 在 FacebookPrineville 展示一個 Big Sur 系統

  該公司也從未迴避讓第三方研究者接觸這些機會的問題。公司和個人可以透過開源計算專案加入該團體,使用開源硬體和軟體併為其做出貢獻。

  Lee 說, 「保密硬體不是我們要做的事。」一隊參觀記者聚集在一個他從伺服器機架裡挪出的 Big Sur 系統前,證明了 Lee所說非虛。當 Lee 取出部件並解釋它們的功能時,記者們一直在瘋狂地拍照。對 Big Sur 內部運作的強烈興趣在 Lee 看來似乎有些蠢——有一份 95 頁的 PDF 線上檔案可以準確地告訴你 Big Sur 的模樣,工作原理以及你該如何構建它。

相關文章