微軟、OpenAI又搞大動作:斥資1000億美元開發AI超算「星際之門」

机器之心發表於2024-04-01

該超級計算機將配備數百萬個專用伺服器晶片,旨在為 OpenAI 的 AI 技術提供強大動力。


根據 Information 訊息,微軟和 OpenAI 正在計劃一個資料中心專案,該專案將包含一個擁有數百萬專用伺服器晶片的超級計算機,以支援 OpenAI 的人工智慧技術。另外,專案成本可能高達 1000 億美元,包括一個名為 Stargate (「星際之門」)的人工智慧超級計算機,預計將於 2028 年啟動。微軟很可能負責資助該專案。
圖片
不過該專案尚未獲得正式批准,未來或許還有變化。

一位知情人士表示,微軟是否願意繼續實施 Stargate 計劃,在一定程度上取決於 OpenAI 提升其人工智慧能力的有效性。因為 OpenAI 去年未能交付其向微軟承諾的新模型。然而,OpenAI 執行長 Sam Altman 公開表示,阻礙更好人工智慧發展的主要瓶頸是缺乏足夠的伺服器。

如果 Stargate 計劃得以實施,它將產生的計算能力將比微軟目前從鳳凰城等地的資料中心提供給 OpenAI 的計算能力大幾個數量級。據這些人士稱,擬議中的超級計算機還將至少需要幾吉瓦的電力 —— 相當於至少執行幾個大型資料中心今天所需的電力,專案的大部分成本將用於採購晶片。
圖片
Stargate 最早在 2028 年啟動,2030 年完成擴充套件,最後階段可能需要多達 5 吉瓦的電力。

這不禁讓我們想起了前段時間網路上一直盛傳的 Altman 籌集 7 萬億美元造晶片廠的事(Altman 對此否認過),不過本著看熱鬧不嫌事大的網友調侃道「Sama 不知怎麼說服了微軟再花 1000 億美元,不過,他仍需要 6.9 萬億美元。」
圖片
Altman 和微軟將這些超級計算機視為五個階段完成,其中第五階段為 Stargate。據兩位知情人士透露,微軟正在為 OpenAI 開發一款規模更小的第四階段超級計算機,計劃在 2026 年左右推出。現在,微軟和 OpenAI 正處於第三階段的中期。

第四、第五階段需要採購大量的 AI 晶片,成本約佔目前正在建設的資料中心初始總成本的一半左右。總而言之,擬議的專案可能花費超過 1150 億美元,是微軟去年在伺服器和其他裝置上支出的三倍多。

微軟發言人 Frank Shaw 沒有對超級計算機專案發表評論,但在一份宣告中表示:我們始終在規劃下一代基礎設施創新,這些創新是繼續推動人工智慧能力前沿所必需的。OpenAI 的發言人對此沒有做出評論。

Altman 曾私下表示,作為 OpenAI 的最大競爭對手之一,谷歌在短期內將擁有比 OpenAI 更多的計算能力,並且他公開抱怨 AI 伺服器晶片沒有達到他的預期。

據參與討論的人士表示,Stargate 旨在讓微軟和 OpenAI 可以選擇使用 Advanced Micro Devices 等英偉達以外公司生產的 GPU,甚至是微軟最近推出的一款人工智慧伺服器晶片。

除了算力,微軟還必須克服技術挑戰。例如,目前提出的設計要求在單個機架上放置比微軟習慣的更多的 GPU,以提高晶片的效率和效能。由於 GPU 的密度更高,微軟還需要想出一種防止晶片過熱的方法。
圖片
OpenAI 總裁 Greg Brockman(左)和微軟技術長 Kevin Scott。

對於上述種種問題,微軟和 OpenAI 仍在敲定幾個關鍵細節,可能不會很快有結論。

對於 OpenAI 來說,證明其下一代大語言模型(LLM)比今天最先進的 GPT-4 有顯著優勢至關重要。OpenAI 一年前釋出了 GPT-4,與此同時,谷歌也釋出了一個類似的模型試圖趕上。據一位瞭解此過程的人士說,OpenAI 計劃在明年初之前釋出其下一代 LLM 的重大升級。在此之前,OpenAI 可能會發布 LLM 的更多漸進式改進。

隨著更多伺服器的可用,OpenAI 可以利用其現有的 AI 和最近的技術突破如 Q*,以在用盡人類生成的資料後訓練更好的模型。這些模型也可能會發現像 GPT-4 這樣的現有模型的缺陷,並建議技術改進 —— 換句話說,實現自我改進的 AI 或許快來了。

參考連結:
https://www.theinformation.com/articles/microsoft-and-openai-plot-100-billion-stargate-ai-supercomputer?rc=ks2jbm

相關文章