確認了!o3-mini幾周內釋出,奧特曼表示AGI只需872兆瓦計算功率

机器之心發表於2025-01-18

昨天,我們報導了一個行業猜想,說是 OpenAI 和 Anthropic 等前沿大模型公司可能已經訓練出了下一代大模型,但由於它們的使用成本過高,所以短時間內根本不會被放出來。但是,為了響應使用者期待,OpenAI 和 Anthropic 等公司會不斷放出一些基於下一代大模型蒸餾得到的較小模型。更多分析請參閱文章《GPT-5、 Opus 3.5 為何遲遲不發?新猜想:已誕生,被蒸餾成小模型來賣》。

有意思的是,就在這篇文章釋出後不久,OpenAI CEO 山姆・奧特曼就在 𝕏 上宣佈將在「周內」釋出 o3-mini,並且這一次會同時釋出 API 與網頁端。從名字也能看出來,o3-mini 應該就是某個大模型的蒸餾版,這似乎也映證了上面的猜想。

圖片
另據 OpenAI 研究科學家 Hongyu Ren 透露,他們會同時釋出 o3-mini 的 high、medium、low 三個版本
圖片
當然,嚴格來說,這並不算是一個新聞。早在上個月 21 日,OpenAI 十二天連發的最後一天,奧特曼就提到過計劃在一月底左右推出 o3-mini,並在不久後推出完整的 o3 模型。更多詳情可訪問《剛剛,OpenAI 放出最後大驚喜 o3,高計算模式每任務花費數千美元》。

這條推文之後,奧特曼又積極地回答了許多網友的提問,為我們揭示了更多細節。

首先,奧特曼證實 o3-mini 的效能表現會遜於 o1-pro,但速度會更快
圖片
這一點著實讓不少網友失望,因為從這個描述看,o3-mini 可能也就比 o1-mini 強一點。
圖片
但其實,OpenAI 此前就已經公佈過相關基準資料了,所以這一點倒並不讓人驚訝。比如在 Codeforces 程式設計基準上,o3-mini (low) 效能不及 o1,high 版本會好一些,但整體都更具成本效益,這使其非常適合用來程式設計
圖片
OpenAI 的 Dylan Hunn 也強調了 o3-mini 在程式設計速度上的優勢。
圖片
或許是為了安撫大家的情緒,奧特曼又抬出了 o3,表示這個版本會比 o1-pro 聰明得多,更別提 o3-pro 了。同時,他也表示 o3-pro 的定價不會是一個月 2000 美元起,200 美元的 Pro 訂閱者應該就能獲得一定的使用額度
圖片
至於 o3-mini 的使用額度,奧特曼只是說「真的高」,從上下文看應該會比 o1 系列的高一些。
圖片
奧特曼也表示 o3-mini 會向 ChatGPT Plus 訂閱者提供,並不限於 200 美元月供的 Pro 使用者。
圖片
另外,奧特曼也談到了 GPT 系列與 o 系列模型品牌融合的問題。看起來,這個融合行動就將在今年發生!
圖片
AGI 需要 872 兆瓦的計算功率

除了與 o3-mini 相關的問題,奧特曼也解答了一個與 AGI 相關的提問。當然,他的答覆已經不是第一次出現了:AGI 可以實現,並且需要 872 兆瓦的計算功率。作為參考,美國目前最大的核電站 Alvin W. Vogtle 發電站的裝機容量為 4536 兆瓦,理想情況下也頂多僅能供養 5 個這樣的 AGI。不過話也說回來,872 兆瓦這個資料著實精確得讓人驚訝。
圖片
那我們目前實際上已經到哪一步了呢?根據 situational-awareness.ai 的估算,目前 AI 的功率應該差不多就在這個水平。
圖片
看起來,OpenAI 確實很有可能已經開發出了下一代模型,甚至有可能達到了 AGI 等級 —— 當然,這得取決於 OpenAI 對 AGI 的具體定義。事實上,已經有人根據所謂的內部訊息在暗示這一點了。
圖片
對此,你有什麼看法呢?

參考連結
https://x.com/sama/with_replies
https://en.wikipedia.org/wiki/List_of_largest_power_stations_in_the_United_States
https://situational-awareness.ai/racing-to-the-trillion-dollar-cluster/

相關文章