「草莓」即將上線,OpenAI新旗艦大模型曝光,代號「獵戶座」
机器之心發表於2024-08-28
本月初,OpenAI 創始人、CEO 山姆・奧特曼突然在 X 上發了一張照片,勾起了大家強烈的好奇心。「四個紅草莓,其中還有一個未成熟的青色草莓,這不妥妥地是在說下一代 AI 大模型 GPT-5 要來了嗎?」奧特曼在回應網友時也在暗示,驚喜馬上就來。據科技媒體 The Information 報導,傳說中的「草莓」真的要來了!兩位參與該專案的人士表示,OpenAI 計劃最早在今年秋天推出代號為 「草莓」(之前稱為 Q*,發音為 Q Star)的新人工智慧,作為聊天機器人的一部分(可能整合在 ChatGPT 內)。「草莓」 可以解決它以前從未見過的數學問題(這是當今的聊天機器人無法準確做到的),並且訓練後還可以解決涉及程式設計的問題,但它並不侷限於回答技術問題。據 The Information 報導,OpenAI 正在開發新旗艦 LLM,代號「Orion」。該模型旨在改進去年年初推出的現有旗艦 LLM——GPT-4。而「草莓」旨在改進即將推出的「Orion(獵戶座)」,並且 OpenAI 已經向安全監管人員展示了「草莓」模型。較小版本的「草莓」可以以聊天機器人的形式推出。知情人士表示:OpenAI 正在使用較大版本的「草莓」來生成用於訓練 Orion 的資料。這種人工智慧生成的資料被稱為「合成資料」。這意味著「草莓」可以幫助 OpenAI 克服獲取足夠高質量資料的限制,以便利用現實世界的資料(例如從網際網路上提取的文字或影像)訓練新模型。當給予額外的「思考」時間時,「草莓」可以回答使用者更主觀的問題,例如產品營銷策略。OpenAI 推出「草莓」是為了保持對話式人工智慧或大型語言模型的霸主地位。該技術還將對未來完成多步驟任務的智慧體產品產生影響。 OpenAI 希望在智慧體領域開闢更多收入機會。「草莓」最重要的應用之一是為下一代旗艦大語言模型 Orion 生成高質量的訓練資料。該代號此前從未被報導過。簡單來說,「草莓」 可以生成更高質量的訓練資料。智慧體初創公司 Minion AI 的執行長、GitHub Copilot 的前首席架構師 Alex Graveley 表示,使用「草莓」生成更高質量的訓練資料可以幫助 OpenAI 減少其模型生成的錯誤(也稱為幻覺)數量,他還指出之所以能夠做到這一點,是因為「訓練資料中的歧義性較少」。這裡不得不提一下,OpenAI CEO 山姆・奧特曼在五月份的一次活動中曾說道:「我們覺得我們已經為下一個模型提供了足夠的(資料),我們做了各種各樣的實驗,包括生成合成資料。」下一個模型可能指的就是「Orion」。OpenAI 內部也在推動透過一種稱為蒸餾(distillation)的過程來簡化和縮小「草莓」。現在還不能確定基於「草莓」的最終的產品將會是什麼樣子,但一個顯而易見的想法是將「草莓」的推理能力融入到 ChatGPT。其結果是答案可能會更準確,但可能會更慢。這意味著「草莓」可能不太適合使用者期望立即得到響應的需求,但非常適合對時間不太敏感的用例。或許我們可以想象,在不久的將來,ChatGPT 使用者可以根據自身對時間的敏感程度來開啟或關閉「草莓」。今年夏天,OpenAI 已經向安全監管人員展示了「草莓」模型。此次演示可能是 OpenAI 努力向政策制定者提高透明度的一部分。鑑於今年早些時候,Ilya Sutskever 等幾位安全負責人的離職,對 OpenAI 來說,技術透明將尤其重要。https://www.theinformation.com/articles/openai-races-to-launch-strawberry-reasoning-ai-to-boost-chatbot-business?rc=ks2jbmhttps://www.theinformation.com/articles/openai-shows-strawberry-ai-to-the-feds-and-uses-it-to-develop-orion?rc=ks2jbm