推理和RL加速GPT-5.5到來?奧特曼公開GPT-4.5已就緒,年底釋出全自主智慧體

机器之心發表於2025-02-09

DeepSeek 以低成本模型攪動全球 AI 格局之際,OpenAI CEO Sam Altman 正在進行他的東京之旅。

截圖2025-02-09 12.11.34.png

與軟銀創始人孫正義敲定 5000 億美元的鉅額投資之前,Sam Altman 和 OpenAI CPO Kevin Weil 到訪了東京大學,在師生問答環節中透露了更勁爆的訊息:

「在 OpenAI 內部,我們已經達到了 GPT-4.5,而達到 GPT-5.5 並不需要 100 倍以上的計算能力。」

「推理模型和強化學習技術的進步極大地提高了計算效率 —— 它允許較小的模型實現 GPT-6 級別的效能,而不需要 100 倍以上的計算能力。」

「我們會把所有模態整合在一起,你可以在畫布上看到,它一邊和你語音,一邊為你編寫和編譯程式碼。它將能夠瀏覽網際網路。」

「o 模型將能支援視覺識別功能,比如某個硬體需要檢修,拍一張照片,o 系列模型將能提供技術支援。」

「o3-mini 預示了未來六到十二個月的研究方向...... 我希望到今年年底,我們能開發出一個除了科學發現,其他高難度任務都被它能解決的智慧體模型,它可能需要幾個小時來思考,甚至可能需要呼叫一堆工具,但它最終能夠為你完成任務。」

雖然這兩位 OpenAI 的高管說著自己是來聽 bug 和功能需求反饋的,但 Sam Altman 還是在不經意間就透露了 GPT 系列的產品規劃以及 DeepSeek 會讓 OpenAI 重新考慮是否開源的回應。尤其值得注意的是,OpenAI 接下來的重點將是高能力的推理模型多模態以及智慧體
推理和RL加速GPT-5.5到來?奧特曼公開GPT-4.5已就緒,年底釋出全自主智慧體影片連結:https://www.youtube.com/watch?v=8LmfkUb2uIY

機器之心在不改變對談原意的基礎上劃好了這場訪談的重點:

GPT 系列模型未來的釋出計劃

Q:如果 ChatGPT 獲得了 100 倍的算力,它會出現什麼新的湧現特性?會出現什麼質的飛躍嗎?

奧特曼:我們正在尋找這個問題的確切答案,「星際之門」專案正在推進,它擁有我們當前的計算叢集大約 100 倍的計算能力。

我們過去的正規化是隻做預訓練,每一代 GPT,第 1、2、3、4 代,每一代的算力都是之前的大約 100 倍,雖然不是精確的 100 倍,但非常接近。每一次迭代,模型都會出現重要的新湧現特性。

我們已經發展到大約 4.5 代。所以如果想達到 5.5 代,還需要再增加 100 倍。然而,去年出現了一件最重要的事,那就是能夠進行推理的新模型。它們在計算效率上有了驚人的提升。透過強化學習,模型可以在很多基準測試上表現出色。這些成果在以前的思路中要擴張到 GPT-6 才能實現,而現在用更小的模型就能做到

所以,我們現在有了一些新的認識。關鍵在於,新方法並不是在所有方面都比舊方法更好,只是在某些特定方面有所提升。不過,我們現在可以更清楚地知道,如果我們用這個新方法去訓練一個更大的模型,大概會達到什麼樣的效果。

基於這種跳躍式進展,我所期待的是 AI 自主發現科學知識,特別是新的物理學或新的生物學知識的能力。

近期推理模型的發展確實令人驚歎。我們的第一個推理模型的水平僅相當於世界排名百萬開外的競賽程式設計師,但隨後我們開發的模型已經能夠躋身世界排名前一萬名。到了 12 月公開發布的 o3 模型,它已經達到了世界第 175 名競賽程式設計師的水平。

目前,我們內部的基準測試顯示,模型水平大約在世界前 50 名左右,我相信到今年年底,我們有望衝擊世界第一的寶座

新的技術正規化展現了驚人的提升速度,並且目前還沒有任何放緩的跡象。

Q:能否分享一下你們未來的各個研究領域的研究計劃,以及你們目前認為什麼是可實現的,什麼是特別具有挑戰性的?

奧特曼我們上週五發布了 o3-mini,我認為這預示了未來六到十二個月的研究方向
圖片
我們會盡可能推進小型的、令人難以置信的高能力、超快速的推理模型。現在這些模型主要擅長 STEM 領域,但它們最終會在所有方面都變得出色。

我們會把所有模態整合在一起。所以在同一個模型中,你可以在畫布上看到,它一邊和你語音,一邊為你編寫和編譯程式碼它將能夠瀏覽網際網路,然後我們會繼續擴大模型規模。所以,你知道,希望能達到 GPT-5、6,或者更多。

今天,我們推出了一個叫做 Deep Research 的新功能。這個功能在專業版計劃中。它有限地進入 Plus 版本,但目前在專業版計劃中。這是我們推出的第二個智慧體產品。它真的很棒,我認為這是我們推出過的最好的產品之一。

你可以給它一個任務,這個任務原本需要你花費很多小時或幾天在網際網路上研究、思考尋找資料,它會給你返回一份報告。它的研究報告確實做得非常好。

比如我很喜歡 90 年代的日本國產車。這個週末我想找一輛特定的車,我找得很困難,於是我想那不如試試用 deep research 來找吧。開始我覺得它不可能找到,結果它找到了整個日本僅有的 3 輛在售車輛,還附帶了現成的聯絡資訊。這是一次令人驚歎的體驗!

所以 OpenAI 會開發更多這樣的智慧體,會繼續推進能夠自主完成有用工作的智慧體。我們討論過如何實現程式設計智慧體的夢想,要達到這個目標還需要大量研究,但我認為 Deep Research 將是一個真正重要的里程碑。

總的來說,我希望到今年年底,我們能開發出一個你可以使用的模型。如果你使用的是專業版,你可以將計算能力調到最大,然後向它提出一個非常難的問題 —— 雖然不是那種需要發現新科學的問題,但除此之外的大多數複雜問題都可以。它會開始工作,可能需要幾個小時來思考,甚至可能需要呼叫一堆工具,但它最終能夠為你完成任務。

不過,要實現這個目標,我們還有很長的路要走。這需要巨大的計算規模,也需要更多的演算法進步。但我相信,這是可以實現的。

ChatGPT 對高等教育的影響

Q:生成式 AI 在未來 10 年、30 年、100 年將如何改變教育?

奧特曼:我認為世界上的每個學生、每個人都能獲得比當下最頂尖的教育還要優質的教育。有些初創的教育公司正在基於 OpenAI 的技術,為每個人提供量身定製的學習方案,針對他們的薄弱點助力他們終身學習。

我認為這大有前景。學生是 ChatGPT 最大的使用者群之一,它天然適合教育,我鼓勵大家都去開發這類教學應用。

談到 100 年後,那將會非常精彩。我還想象不到 100 年後 AI 的能力會如何。先看 10 年後,我認為 AI 仍將極大地改變世。科學進步和科學發現的速度可能比現在快 10 倍,也許是 100 倍。

這將極大地提高生活質量,比如太空探測器將超越太陽系,但與此同時,人們仍會過著一如既往的生活,仍然會有很強的動力去和朋友聚會、建立家庭、發展興趣愛好。但從另一種意義上說,人之為人的本質不會改變。我一點也不擔心人類會失業,只是環境會改變,工作會不同,但人類社會的運作方式還將如常

Q:全世界如何公平地獲取這些 AI 工具?

奧特曼:我們在辦公室經常說「智慧變得如此便宜,以至於不值得去計較成本了」。我們的目標是努力把智慧的成本降到儘可能接近零,讓全世界的人都能免費使用。

為了證明我們是認真的,現在的模型比兩年前推出的 GPT-3 智慧得多,而價格只有 GPT-3 最初的 1%。所以成本已大幅下降,我們想要繼續保持這個趨勢。

Q:你認為在 AI 時代,亞洲會更看重什麼樣的人才和技能?給學生們一些建議,你認為什麼樣的才能和技能最寶貴、最重要?

奧特曼:我們是否會比 AI 更擅長數學,或者比 AI 更會程式設計?答案是否定的。你不會在這些方面比 AI 更好。

就像當剛計算器發明時,有人會覺得無論計算器有多厲害,自己還是會在算數方面強過計算器,但我們現在已經知道了,沒有人能在算數的方面比過計算器。

所以在 AI 時代所需的具體技能方面,你要能借助 AI 做一些以前沒人能做到的事情。以經營一家公司的方法來用 AI,你提出想法,讓 AI 執行,再進行協調

在這個世界裡你需要的技能是:找到人們的需求具有創造性的願景快速適應能力在一切都在變化時保持韌性,以及學會如何使用這些工具去提效,而不是試圖做到「我要算得比計算器還快」。

Kevin Weil:對我來說,其中的教訓和現在要記住的是:開始使用 AI 工具,開始將它們融入你的工作方式,融入你的學習方式。當你在做事時,先問問自己:「AI 是否能幫我更快完成?這件事一定要我自己來做嗎?還是可以把它外包給 AI?

奧特曼:有一種錯誤的觀點是,AI 會在所有方面打敗人類,人類社會將被 AI 結束,其實不然,作為人類,我們也在適應新技術。這是一種共同進化,我們將在 AI 的助力下獲得無法想象的能量,應該這麼想。

Kevin Weil:順便說一下,有一本沃頓商學院教授 Ethan Malik 寫的書叫《Co Intelligence》。這本書很短,大約 100 頁,但它包含了很多關於他如何用 AI 教學以及學生如何思考與 AI 合作的深刻見解。我認為很值得一讀。

「DeepSeek 開源影響你們了嗎?」

Q:早些時候,你提到要讓智慧對每個人都可獲取。隨著中國 DeepSeek AI 的最近釋出以及公開權重和架構,OpenAI 遠離開源的有效性受到了質疑。你們是否有計劃重新考慮這個立場?理由是什麼?
圖片
奧特曼:是的,我們會這樣做。我不知道具體要開源什麼或者具體什麼時候,但對我們來說,發展方向似乎是朝著更多開放模型的方向發展,而社會願意接受隨之而來的權衡,至少目前是這樣。我認為我們在讓這些模型在開源使用中普遍安全和穩健方面取得了良好進展。它們不會都被這樣使用,但大多數時候還會是這樣的。

Q:1)過去兩年我一直在使用 OpenAI 作為我的個人助理,非常有幫助。我想知道隨著腦機介面的發展,你認為它將如何影響人們的意識在未來的存在方式?2)我正在學習小型衛星工程,我在製造用於太空的小型衛星。我有一個關於衛星和 AI 的問題,因為通常來說,將 AI 用於新技術比如衛星、太空這樣的領域是非常困難的。所以你對 AI 和空間工程的發展前景有什麼看法?3)你能分享一下關於 10 年後 AI 會是什麼樣子的想法嗎?

奧特曼:讓我們快速回答這些問題。關於腦機介面,現在是追求這個的絕佳時機。顯然,我們會找到一些解決方案,獲得某種直接訪問的方式。這可能需要一段時間,但正如你所想的,AI 將會非常驚人。我對許多具有破壞性的方法持懷疑態度,但我認為有一些較輕量級的方法,你可以學習如何使用介面,而且可以逐漸輸入到你的大腦中,對吧,我們會找到解決方案的。我認為在過去六個月裡,很多有趣的新公司都在朝這個方向發展。Kevin 你要回答太空那個問題嗎?

Kevin Weil:好的。在我來 OpenAI 之前,我在一家叫做 Planet 的公司工作,該公司製造衛星並每天對整個世界進行成像。我們最近發射的衛星裝有 GPU,目的是在太空中執行 AI 模型,為了更快地傳送結果等。我同意你的看法,這很有挑戰性。我們現在每三個月釋出一個新模型,而太空專案時間線要長得多。

但隨著模型發展,我的意思是,我們在向太空輸送更多能量方面做得越來越好。火箭變得更大,所以你可以發射更大的衛星,更大的太陽能電池板,而模型變得更小,你可以更高效地執行它們。

我的答案是,一切都在朝著太空中有更多 AI 的方向發展,這是一個相當酷的結果。

奧特曼:第三個問題是要做一個具體的預測。如果我們談論 2025 年地球上的總智慧,所有人、協作、AI,就是地球上的總智力容量。我認為到 2035 年,如果進步的趨勢繼續下去,那麼一個單獨的資料中心就會比地球當前的總智力容量更強大。

Q:我們知道訓練 AI 模型需要大規模資料集,但是對於當時非常稀缺的資料集,OpenAI 推薦什麼樣的策略來訓練這樣的模型?

Kevin Weil:我們看到的一個有趣的現象是,隨著模型變得更智慧,你需要更少的樣本來微調它們、讓它們學習新東西。這個趨勢正朝著正確的方向發展,非常智慧的模型能夠透過更少的資料點來學習新領域。

創業、機器人和技術追趕

Q:我想創業。最重要的事情是什麼?

奧特曼:在開始創業之前,我曾經運營一個叫做 Y Combinator 的專案來幫助人們創業。我認為早期團隊成員最重要的是那些充滿能量、非常堅定的人。有一句 Paul Graham 的話叫做「be relentlessly resourceful」,這就是你需要尋找的特質。初始團隊成員比任何具體專業知識都重要。新業務的早期階段非常困難,所以你需要有這種能量的人。

Kevin Weil:我同意這個觀點。我認為你會遇到各種各樣的事情,你需要那些靈活的人、那些不會放棄的人、很好的學習者,因為你會遇到你從未預料到的事情。所以你需要那些會說「哦,我能搞定這個,讓我去試試」的人。

Q:我們如何能建立一組機器人,讓它們開發自己的語言來相互交流並培養屬於自己的文化?

奧特曼:我認為關鍵因素之一可能是將眼睛和耳朵整合到抽象思維框架中。現在第一批智慧體開始上線,你開始看到人們在構建一些東西,有些人稱之為群體,有些人稱之為團隊、智慧體文明等。我預計它們會發展出新的交流和共享資訊的方式。

它可能不會像科幻電影讓我們相信的那樣戲劇性和令人興奮,但它會發生,而且會起作用。我認為你不需要物理的眼睛和耳朵,但你確實需要良好的輸入輸出。我認為我們開始看到這一點了。這些多智慧體的事情非常令人興奮。

Q:我主修電氣和電子工程,我正在準備與出版商合作開發 AI 驅動的圖書搜尋引擎。考慮到技術進步如此之快,感覺像 AI 或 LLM 這樣,我如何建立和保持競爭優勢?

奧特曼:正常的商業規則仍然適用,你仍然需要找到能建立一些具有持久價值、粘性和差異化的東西。有很多創業公司說,好吧,我在使用 AI,所以這些規則不適用。但它總是適用的。否則,你將無法建立差異化。我認為關於創業最好的書仍然是 Peter Thiel 寫的《從 0 到 1》,現在可能已經有 10 年了,但它在書中詳細討論了什麼是長期競爭優勢。

Kevin Weil:我引用 Sam 之前說過的話,就是當你談論如何針對越來越好的 AI 進行構建時。你要建立的東西應該處於前沿,真正推動模型能力的邊界。

如果你在建造某個東西,而你對我們的下一個模型釋出感到緊張,因為它可能能夠做你正在做的事情,那說明不是一個好的位置。但如果你正在構建某個東西,而你迫不及待地等待我們的下一個模型釋出,因為你正處於能力的邊緣,我們下一個更智慧的模型釋出會讓你的產品變得更棒,那就是一個好位置。

相關文章