OpenAI 真是把大家的胃口吊足了,大家再忍忍就等到了。
今日凌晨 OpenAI 官宣,將於美國時間 13 日上午 10 點進行一場直播。Sam Altman 隨即轉發這一訊息,並表示「不是 gpt-5,不是搜尋引擎,但我們一直在努力開發一些我們認為人們會喜歡的新東西!我感覺這就像魔法一樣。」關於即將釋出的內容,OpenAI 官方帖子提供的唯一細節是,此次釋出將更新 ChatGPT 及其最新模型 GPT-4。OpenAI 員工程博文(Bowen Cheng)跟了個帖,「比 gpt-5 更酷」,不過又迅速刪帖。OpenAI 的葫蘆裡到底賣的什麼藥?據 The information 報導,OpenAI 開發了一款 AI 語音助手,具有音訊輸入、音訊輸出功能和更好的推理能力,甚至在某些方面擊敗了 GPT-4 Turbo。該 AI 語音助手很可能就在週一的這場直播中公開亮相。不管怎樣,OpenAI 此番舉動著實吊足大眾胃口。據 The information 報導,OpenAI 正在構建一款 AI 語音助手,它能透過聲音和文字與人類對話,並能識別物體和影像。據兩位接觸過這項新 AI 的人士透露,ChatGPT 的開發者已經向一些客戶展示了部分功能,這些功能在邏輯推理方面超越了其現有產品。OpenAI 執行長 Sam Altman 的目標是最終開發出可高度響應的人工智慧,類似於電影《她》(Her)中的虛擬助手,提升蘋果 Siri 等現有語音助手的可用程度。一名知情人士表示,這個 AI 語音助手可能會在 OpenAI 週一的直播中公開亮相,趕在谷歌釋出一系列 AI 產品之前搶得先機。OpenAI 認為,具備視覺和音訊能力的智慧助手擁有與智慧手機相媲美的變革性潛力。理論上它能夠做到當前無法做到的事情,比如充當學生的家庭教師,輔助撰寫論文或解決數學難題,或者翻譯交通標識、指導解決汽車故障等。
不過,這類技術目前無法在個人裝置上執行,使用者可以在短期內使用基於雲的版本來獲取這些功能,如自動化服務 Agent。知情人士表示,新語音助手的音訊功能可以幫助客服人員更好地理解來電者的語氣。
OpenAI 已經推出具備音訊轉錄、文字轉語音等功能的軟體,不過這些功能是基於獨立的對話 AI 模型實現,而新的語音助手則將這些功能整合在一起,使其在影像和音訊理解方面更勝一籌,並且速度更快。
目前尚不清楚 OpenAI 何時會將這些新功能提供給付費客戶,但知情人士透露,這些功能將被納入 ChatGPT 的免費版本中,旨在使其執行成本低於 GPT-4 Turbo。該人士還表示,AI 語音助手在回答某些型別的問題上表現優於 GPT-4 Turbo,但仍存在「幻覺」。其實,利用 AI 開發強大的助手,谷歌早有此想法。去年 12 月,谷歌釋出了一則 Gemini 的影片,它能夠實時響應人的語音命令,並識別出人正在看的影像。然而,谷歌後來解釋說,這些功能需要研究人員用影像和文字指令提示模型,而不是影片中演示的簡單對話。而 OpenAI 推出語音助手主要為了「狙擊」谷歌、蘋果。
除了即將釋出的具有音訊和視覺功能的模型外,OpenAI 一直計劃推出 AI 搜尋引擎,旨在與谷歌競爭。此外,OpenAI 還在開發一種被稱為「計算機使用 Agent」的自動化軟體,可以加速軟體開發和其他基於計算機的任務。更重要的是,GPT-5 也在馬不停蹄地研發中。據一位與 OpenAI 領導層討論過此事的人士表示,OpenAI 可能會在今年年底完成 GPT-5 並公開發布。OpenAI 還計劃釋出一個新的定價模型。據知情人士透露,如果客戶預付費用來預訂 tokens,他們可能會獲得高達 50% 的折扣。目前,OpenAI 主要提供按需定價,每百萬 tokens 的價格為幾美分到 120 美元不等,一些較大的客戶會獲得批次折扣。今年 4 月 OpenAI 推出了 Batch API,該應用程式程式設計介面會提供更便宜的價格。不過,OpenAI 在產品和 AI 模型開發上的迅猛勢頭也導致之前釋出的一些專案備受「冷落」。例如,OpenAI 曾承諾,到今年第一季度,開發者就能透過為其商店構建定製聊天機器人來賺錢,但截至目前 OpenAI 也未兌現承諾。據報導,蘋果公司計劃將其虛擬助手 Siri 引入生成式 AI。知情人士透露,新的 Siri 將變得更加「對話化和多功能化」,並將採用生成式 AI 驅動的系統,使其能夠總結簡訊內容並進行對話,而不僅僅是逐個回應問題。Siri 和蘋果公司的其他 AI 產品預計將在 6 月 10 日的蘋果年度開發者大會上亮相。去年年初,蘋果公司的高管們在把玩 OpenAI 的 ChatGPT 後,發現 Siri 相形見絀,於是決定對 Siri 進行升級。這也促使蘋果進行了十多年來最重要的重組,以便在這場激烈的人工智慧「軍備競賽」中迎頭趕上。但是,蘋果並未選擇釋出一款與 ChatGPT 直接競爭的產品,而是決定提高 Siri 作為虛擬助手處理其已經能夠完成的任務的能力。新 Siri 的宣傳點在於它比其他 AI 工具更私密,因為使用者請求將在 iPhone 上處理,而不是在資料中心。但是,這種做法也有其缺點,與大型 AI 系統相比,小型 AI 系統更容易產生幻覺。蘋果還計劃在其新款 iPhone 中增加記憶體,以支援 Siri 的 AI 功能,並一直在與谷歌和 OpenAI 等競爭對手洽談,旨在將最新的 AI 模型整合進下一代 iPhone 作業系統。
據彭博社最新報導,蘋果已接近與 OpenAI 達成協議,將在下一代 iPhone 作業系統 iOS 18 中使用 ChatGPT;與谷歌尚未達成協議,但談判仍在進行中。
https://x.com/amir/status/1789059948422590830https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-applehttps://techcrunch.com/2024/05/10/openais-chatgpt-announcement-what-we-know-so-far/https://www.businessinsider.com/apple-siri-generative-ai-improvements-iphone-report-2024-5