昨天,我們報導了一個行業猜想,說是 OpenAI 和 Anthropic 等前沿大模型公司可能已經訓練出了下一代大模型,但由於它們的使用成本過高,所以短時間內根本不會被放出來。但是,為了響應使用者期待,OpenAI 和 Anthropic 等公司會不斷放出一些基於下一代大模型蒸餾得到的較小模型。更多分析請參閱文章《GPT-5、 Opus 3.5 為何遲遲不發?新猜想:已誕生,被蒸餾成小模型來賣》。
有意思的是,就在這篇文章釋出後不久,OpenAI CEO 山姆・奧特曼就在 𝕏 上宣佈將在「幾周內」釋出 o3-mini,並且這一次會同時釋出 API 與網頁端。從名字也能看出來,o3-mini 應該就是某個大模型的蒸餾版,這似乎也映證了上面的猜想。
另據 OpenAI 研究科學家 Hongyu Ren 透露,他們會同時釋出 o3-mini 的 high、medium、low 三個版本。當然,嚴格來說,這並不算是一個新聞。早在上個月 21 日,OpenAI 十二天連發的最後一天,奧特曼就提到過計劃在一月底左右推出 o3-mini,並在不久後推出完整的 o3 模型。更多詳情可訪問《剛剛,OpenAI 放出最後大驚喜 o3,高計算模式每任務花費數千美元》。這條推文之後,奧特曼又積極地回答了許多網友的提問,為我們揭示了更多細節。首先,奧特曼證實 o3-mini 的效能表現會遜於 o1-pro,但速度會更快。這一點著實讓不少網友失望,因為從這個描述看,o3-mini 可能也就比 o1-mini 強一點。但其實,OpenAI 此前就已經公佈過相關基準資料了,所以這一點倒並不讓人驚訝。比如在 Codeforces 程式設計基準上,o3-mini (low) 效能不及 o1,high 版本會好一些,但整體都更具成本效益,這使其非常適合用來程式設計。OpenAI 的 Dylan Hunn 也強調了 o3-mini 在程式設計速度上的優勢。或許是為了安撫大家的情緒,奧特曼又抬出了 o3,表示這個版本會比 o1-pro 聰明得多,更別提 o3-pro 了。同時,他也表示 o3-pro 的定價不會是一個月 2000 美元起,200 美元的 Pro 訂閱者應該就能獲得一定的使用額度。至於 o3-mini 的使用額度,奧特曼只是說「真的高」,從上下文看應該會比 o1 系列的高一些。奧特曼也表示 o3-mini 會向 ChatGPT Plus 訂閱者提供,並不限於 200 美元月供的 Pro 使用者。另外,奧特曼也談到了 GPT 系列與 o 系列模型品牌融合的問題。看起來,這個融合行動就將在今年發生!除了與 o3-mini 相關的問題,奧特曼也解答了一個與 AGI 相關的提問。當然,他的答覆已經不是第一次出現了:AGI 可以實現,並且需要 872 兆瓦的計算功率。作為參考,美國目前最大的核電站 Alvin W. Vogtle 發電站的裝機容量為 4536 兆瓦,理想情況下也頂多僅能供養 5 個這樣的 AGI。不過話也說回來,872 兆瓦這個資料著實精確得讓人驚訝。那我們目前實際上已經到哪一步了呢?根據 situational-awareness.ai 的估算,目前 AI 的功率應該差不多就在這個水平。看起來,OpenAI 確實很有可能已經開發出了下一代模型,甚至有可能達到了 AGI 等級 —— 當然,這得取決於 OpenAI 對 AGI 的具體定義。事實上,已經有人根據所謂的內部訊息在暗示這一點了。https://x.com/sama/with_replieshttps://en.wikipedia.org/wiki/List_of_largest_power_stations_in_the_United_Stateshttps://situational-awareness.ai/racing-to-the-trillion-dollar-cluster/