遊戲結束了?OpenAI可能已經突破,跨過起飛的最後臨界閾值

机器之心發表於2025-01-17

OpenAI 的研究達到了可以自我遞迴改進的程度?


剛剛,X 上的一則帖子爆火,瀏覽量達到 30 多萬。

該推文涉及引領 AI 潮流的 OpenAI。內容顯示「OpenAI 遞迴式自我改進目前在一個盒子裡,準確的說是在一個無法破解的盒子!」
圖片
我們不難看出,帖子內容突出了 OpenAI 的發展態勢,AI可以自我改進,並且很難有人短期內破解。還有一則帖子表示:

「OpenAI 可能已經獲得了突破,並最終跨越了臨界點,達到一個起飛狀態 —— 即智慧達到了可以自我遞迴改進的程度,o4 或 o5 將能夠自動化 AI 研發並完成其餘工作。

像 o1 這樣的模型的大部分意義不在於部署它,而在於為下一個模型生成訓練資料。o1 解決的每一個問題現在都是 o3 的訓練資料點。

實際上我們有點驚訝於 OpenAI 竟然費心的部署了 o1-pro,而不是將其保持私密並投資計算資源進行更多的 o3 訓練等。這顯然與 Anthropic 和 Claude-3.6-opus 的開發不同,這個模型沒有研發失敗,只是 Anthropic 選擇將其保持私密,並將其蒸餾成一個小而便宜但很智慧的 Claude-3.6-sonnet。

如果你想知道為什麼 OpenAI 的人突然在 X 上變得幾乎是狂喜地樂觀,認真觀察從原始 4o 模型到 o3 的改進可能就是原因。

這就像觀看 AlphaGo 的 Elo 曲線:它只是不斷 up……up……up……

這給我們一種感覺,他們已經獲得突破,終於跨越了臨界點,即從僅僅是尖端 AI 工作(其他機構將在幾年內才能複製),到起飛(破解智慧),以至於 o4 或 o5 將能夠自動化 AI 研發並完成其餘工作。」
圖片
圖片
在這條推文下,大家的討論格外熱烈。

有人表示「如果這是真的,如果模型不需要人類進行訓練,那麼《駭客帝國》的結果就不再有效了。」
圖片
「我一直是這麼想的,OpenAI 沒有向公眾釋出他們最新的優秀模型,他們總是在內部領先 1 或 2 代,因為這為他們提供了開發優勢。」
圖片
「也許最可怕的不是上述觀點是否正確,而是我們無法判斷他是否錯誤。」
圖片
就連 OpenAI 研究員 Jason Wei 也跑到評論區發言:魔法,就是當一個不可阻擋的強化學習(RL)最佳化演算法,在充足的計算資源驅動下,遇到一個無法被攻破的強化學習環境時,奇蹟就發生了。
圖片
Andrej Karpathy 也發表了自己的觀點:魔法就是當最佳化技巧破解了那個環境時,就會出現。
圖片
對於上述觀點,你怎麼看,歡迎評論區留言。

參考連結:
https://x.com/AISafetyMemes/status/1879624959934497078
https://x.com/AISafetyMemes/status/1879938756334977117

相關文章