這項高階語音功能,大家可是等了好久。
谷歌又被 OpenAI 截胡了。
前腳谷歌剛剛升級完兩款模型 Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002,後腳奧特曼就直接宣佈 GPT-4o 今天起正式開放。
「高階語音功能今天推出!(將在本週內完成),希望您的等待值得。」奧特曼表示道,最後還不忘加一個委屈、小桃心的表情。
這次,OpenAI 的高階語音功能將向所有的 Plus 和 Team 使用者推出。但免費使用者是體驗不了了,因為 OpenAI 暫時沒有這個計劃。
據瞭解,Plus 使用者每月需支付 20 美元,Team 使用者每月支付 30 美元並擁有更多的使用次數。OpenAI 將逐步向使用者推出訪問許可權,並從下週開始面向企業和教育推出。所有 Plus 使用者將在秋末之前獲得訪問許可權。
如果你是 Plus 或 Team 使用者,當訪問高階語音功能時,會在應用程式中看到如下通知。
此次推出的高階語音功能還新增了自定義指令、記憶、五種新聲音和改進的口音。它還可以用 50 多種語言說「抱歉我遲到了」。
在下面展示的影片中, 使用者和模型在流暢的對話,你可以隨時打斷聊天內容,彷佛和你聊天的不是機器,而是一個真人。這段 Demo 中的對話內容也特別有意思, GPT-4o 用一口流利的中文說「奶奶對不起,我遲到了,我不是故意讓您等這麼久的……」,彷彿是 OpenAI 在和使用者們道歉,要知道,GPT-4o 可是遲到了將近半年的時間才正式推出。
看在 OpenAI 這麼誠意的份上,大家紛紛表示接受道歉。
在下面的示例中, OpenAI 專案主管 Charlotte 透過自定義選項向 ChatGPT 提供了自己的資訊,比如名字和住址。然後在新對話中詢問了週末可以做的有趣的戶外活動。ChatGPT 根據 Charlotte 提供的資訊,給出了一些可行建議。在另一個影片中,OpenAI 負責模型設計的 Drew 表示,他在工作時,會讓 GPT-4o 靜靜地開著,當不與它交談時它很安靜,等有問題時就會提問,然後圍繞這個問題會展開一場長對話。大多數情況下,Drew 會把它當作坐在身邊的朋友,能為他提供資訊,交流想法。
此前,GPT-4o 釋出不久,OpenAI 就因其演示影片中名為 Sky 的女性聲音與電影《Her》中飾演 AI 戀人的斯嘉麗・約翰遜的聲音相似而受到批評。OpenAI 隨後刪除了該聲音。
現在,最新推出的五種新聲音分別被命名為 Arbor、Maple、Sol、Spruce 和 Vale,將在標準和高階語音模式下提供。OpenAI 表示,這些聲音是使用來自世界各地的專業配音演員製作的。他們採訪了數十位演員,他們的聲音溫暖、平易近人、具有豐富的質感和語調,一位公司發言人表示。
不過,新功能尚未在歐盟、英國、瑞士、冰島、挪威或列支敦斯登推出。
還在休假的 Greg Brockman 也幫忙宣傳了一波:「高階語音的推出,讓你可以和 ChatGPT 開啟流暢的對話,讓你意識到在電腦上打字是多麼的不自然。」
除了上新高階語音模式,近日,OpenAI 還發布了一個多語言大規模多工語言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)資料集,測試集提供了 14 種語言,包括阿拉伯語,德語,西班牙語等,涵蓋 57 個不同類別的主題,包括初級知識、法律、物理、歷史和電腦科學等高階專業學科。
資料集地址:https://x.com/_philschmid/status/1838230108072476951
參考連結:https://www.technologyreview.com/2024/09/24/1104422/openai-released-its-advanced-voice-mode-to-more-people-heres-how-to-get-it/