斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音;微軟推出 AI 工具「回顧」(Recall)丨 RTE 開發者日報 Vol.208
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real Time Engagement)領域內「有話題的 新聞」、「有態度的 觀點 」、「有意思的 資料」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
01 有話題的新聞
1、微軟推出 Copilot+ PCs,釋出「過目不忘」的「回顧」(Recall)功能
5 月 21 日,微軟公司於北京時間凌晨 1 點舉辦的 Build 開發者前瞻大會上,微軟執行長薩蒂亞・納德拉上臺演講,提出了「Copilot+ PCs」宣傳名稱,並將其描述為「新一類 Windows PC」。
這次 Copilot+PC 上增加了一個驚豔的「回顧」(Recall)功能,類似於「時光倒流」,這也是此次釋出會的最大亮點。AI 可以找到你曾經在電腦上做的「任何事」,只要螢幕顯示過的內容,AI 就能幫你找到。
Copilot+ PCs 的一項硬體要求是不依賴雲,可以在本地處理生成式 AI Copilot 程序,這就需要配備神經處理單元(NPU)的晶片組。高通公司等製造商已經透過驍龍 X Elite 等晶片奠定了基礎。微軟正在採取合作伙伴優先的方式製造 Copilot+ PC。除了 AMD、英特爾和高通等晶片製造商,宏碁、華碩、戴爾、惠普和聯想等主要原始裝置製造商也加入了進來。
微軟表示已經重構 Windows 11 系統,Copilot+ PC 相比配備 M3 處理器的最先進 MacBook Air 快 58%,而且續航時間超過 1 天時間。微軟還透露,它的 Copilot+ 個人電腦現在將在 OpenAI 的 gpt-4o 模型上執行,允許助手透過文字、影片和語音與你的電腦互動。使用者還可以與 Copilot 共享他們的螢幕,並與該應用程式進行自然對話。(@IT 之家、@ 智東西)
2、斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音並要求下架
國際著名影星斯嘉麗 - 約翰遜指控 OpenAI 的 ChatGPT,非法使用其聲音並要求下架。
目前,ChatGPT 的語音模式一共有 Breeze、Cove、Ember、Juniper 和 Sky 五種聲音,斯嘉麗指責的是其中的「Sky」模式,聽來和她本人的聲音相似度高達 90% 以上。
OpenAI 最新發布 GPT-4o 語音模式的配音和斯嘉麗也很像。而斯嘉麗正是 2013 年著名科幻 AI 電影《Her》的女主 AI 配音,這也是 OpenAI 執行長 Sam Altman 最喜歡的電影之一。
斯嘉麗在社交平臺釋出了一篇長文,把整個事情的來龍去脈說了一遍。她表示,2023 年 9 月,ChatGPT 推出語音模式時,OpenAI 曾找過她希望為其配音,由於個人原因拒絕了。
就在產品釋出會的前兩天,OpenAI 還曾試圖說服斯嘉麗,再次遭到拒絕。但在真正釋出時,斯嘉麗聽到其中的「Sky」和她本人聲音太像了,很可能是找人模仿了她的聲音。
此外,Sam Altman 在 GPT-4o 釋出時在社交平臺上只發了一個詞「Her」,這明顯是在暗示斯嘉麗的聲音。(@AIGC 開放社群)
3、GPT-4o 釋出後,OpenAI 移動端訂閱收入創歷史記錄!單日淨收入達 90 萬美元
上週,OpenAI 推出了最新旗艦模型 GPT-4o,這也帶動了 OpenAI 移動端收入實現有史以來最大增長。根據 Appfigures 資料,GPT-4o 正在推動更多使用者升級到 付費訂閱。
GPT-4o 可以處理文字、語音和影片,並提供實時響應和一系列情感語音選項,使其成為比以前提供的模型更強大的模型。如果移動使用者想嘗試 OpenAI 最新推出的產品,必須升級到每月 19.99 美元的訂閱 ChatGPT Plus。
Appfigures 指出,ChatGPT 移動應用淨收入在 GPT-4o 釋出當天首次躍升 22%,並在接下來的幾天裡繼續增長。上週二,其淨收入高達 90 萬美元,幾乎是日均收入 49.1 萬美元的兩倍。
ChatGPT 移動應用在上週 App Store 和 Google Play 上淨收入為 420 萬美元,是該應用迄今為止最大收入增幅,收入大幅增長表明使用者確實有嘗試最新 AI 體驗的需求,尤其是在移動裝置上,即使它比 Netflix 訂閱更貴。(@ 有新 Newin)
4、NetBSD 禁止 AI 生成程式碼
BSD 發行版專案 NetBSD 禁止使用 ChatGPT、Copilot 等 AI 工具生成程式碼。BSD 更新了它的 commit 指南:如果程式碼非開發者本人編寫,那麼需要仔細檢查程式碼的許可證是否允許匯入到 NetBSD 的原始碼庫,允許自由分發。開發者需要聯絡原始碼的作者,確保他們是程式碼的唯一作者,並驗證確保沒有複製其它程式碼。由 GitHub/Microsoft Copilot,OpenAI ChatGPT 或 Facebook/Meta Code Llama 等大模型生成的程式碼被認為很可能複製自不同許可證授權的程式碼,BSD 要求未經核心團隊批准不得遞交這些 AI 工具生成的程式碼。( @CSDN)
5、京東支付與微信支付實現互聯互通
近日,京東支付和微信支付實現互聯互通,成為行業首家同時打通微信個人碼和商家碼的第三方支付機構。
據介紹,使用者可以透過京東金融 App 掃微信收款碼,商家提供的微信收款二維碼都可以掃,付款時還可享受立減優惠,最高可減 30 元。
京東支付也補充表示,微信收款二維碼指微信的個人碼、商家碼,此次互聯互通是在網聯清算公司統一業務規則和技術標準下的接入。(@ 愛範兒)
02 有態度的觀點
1、何小鵬:2025 年在中國實現類 L4 級智駕體驗,智駕技術開始走向全球
5 月 20 日,在小鵬汽車 520 AI DAY 上,小鵬汽車董事長、CEO 何小鵬發表演講。他表示,上個 10 年,是新能源汽車時代;下個 10 年,是智駕汽車時代。
釋出會上,他宣佈小鵬端到端大模型在國內首個量產上車,智駕能力提升 2 倍。他表示,小鵬端到端大模型 2 天迭代 1 次,智駕能力 18 個月提升 30 倍。
何小鵬還透露,2024 年第三季度,NGP 不僅全國都能開,而且全國每條路都能開。2025 年城區智駕比肩高速智駕體驗。另外,2025 年在中國實現類 L4 級智駕體驗,智駕技術開始走向全球。
他還公佈了小鵬以智駕為核心的 AI 技術投入:2024 年智慧研發投入 35 億元,每年算力訓練投入 7+ 億元,2024 年新招募人員 4000 人。(@ 新浪科技)
2、張亞勤:我對人工智慧發展的六大趨勢判定和三大風險預警
2024 為 AI 應用爆發元年,這個論斷,似乎已經開始成為 AI 產業的某種共識。大模型經過一年多狂飆式發展,模型能力已經基本可以支撐應用的爆發,AI 走入產業、甚至走入普通人生活的速度正在加快。在這個時間節點,行業已經從對大模型能力的驚歎、驚喜及技術追趕的焦慮中,切換到了理性看待這項技術的發展,冷靜分析未來的技術演進趨勢與潛在風險。
在2024年5月19日舉辦的 C3 安全大會上,中國工程院院士、清華大學智慧產業研究院院長 張亞勤發表了以「AI 大模型機遇和風險」為主題的演講。張亞勤認為,大模型是 AI 時代的作業系統,正在孕育新的生態。
「人工智慧正在從多個模型多演算法,走向相對單一的框架、多模態、大一統的模型。」在演講中,他總結了大模型生成的六大趨勢、三大風險(資訊、物理和生物世界的風險),並針對這三大風險,提出了五個具體建議。(@AI 未來指北)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- 斯嘉麗約翰遜拒絕OpenAI聲音授權OpenAI
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- Hume AI 推出 EVI 2 情感模型;OpenAI o1 模型問世,模擬人類思考問題 丨 RTE 開發者日報模型OpenAI開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 新 Chrome 外掛可檢測 AI 偽造聲音;Canary Speech 推出用於臨床對話的語音分析技術丨 RTE 開發者日報ChromeAI開發者日報
- Amphion 推出開源 TTS 模型 MaskGCT,5 秒克隆聲音;神秘文生圖模型「小熊貓」登頂競技場丨 RTE 開發者日報TTS模型GC開發者日報
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- 谷歌破解 OpenAI 模型關鍵資訊;微軟更改預設瀏覽器,不再主推 Edge 丨 RTE 開發者日報 Vol.163谷歌OpenAI模型微軟瀏覽器開發者日報
- 小米回應「網友惡搞 AI 雷軍配音罵人」;Hailuo AI 上線圖片生成影片功能丨 RTE 開發者日報AI開發者日報
- ElevenLabs Voice Design :可透過文字建立個性化語音;蘋果推出首個開發者測試版丨 RTE 開發者日報蘋果開發者日報
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- Mistral 釋出 Large 2 123B 大模型;微軟釋出 VALL-E 2,零樣本實現聲音克隆丨 RTE 開發者日報大模型微軟開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- Fish Agent:多語言 Voice-to-Voice 開源語音模型;Runway 推出攝像機運鏡功能丨 RTE 開發者日報模型開發者日報
- 微軟 Azure 推出文字到語音虛擬人;英偉達釋出 8B 小語言模型,可在 RTX 工作站部署丨 RTE 開發者日報微軟模型開發者日報
- OpenAI 再發 Sora 新短片,傳 Sora 兩週內推出;李飛飛團隊出品空間智慧版 ImageNet 丨 RTE 開發者日報OpenAISora開發者日報
- OpenAI 成功收購 Chat.com 域名;AI「電子舌頭」問世,可辨別味道、檢測食品安全丨 RTE 開發者日報OpenAI開發者日報
- ElevenLabs Voice Design:文字生成個性化語音;科學家用 AI 解讀豬叫聲背後情緒和壓力丨 RTE 開發者日報AI開發者日報
- Meta 公佈首款 AR 眼鏡 Orion,成本 1 萬美元;OpenAI CTO Mira Murati 離職丨 RTE 開發者日報OpenAI開發者日報
- 爆火 AI 硬體遭差評,Ai Pin 上市即翻車;Grok 推出首個多模態模型丨 RTE 開發者日報 Vol.184AI模型開發者日報
- 平價 Vision Pro 需搭配 Mac/iPhone;OpenAI 收購實時分析資料庫公司丨 RTE 開發者日報MaciPhoneOpenAI資料庫開發者日報
- 沒有方向盤和踏板,特斯拉釋出無人駕駛計程車;位元組豆包推出 AI 智慧體耳機 Ola Friend 丨 RTE 開發者日報AI智慧體開發者日報
- 11Labs 支援打造對話 AI 智慧體;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 開發者日報AI智慧體阿里大模型開發者日報
- 亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報亞馬遜AIChatGPT開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- OpenAI 釋出 AI 生成圖片檢測器;特斯拉計劃在中國測試自動駕駛計程車丨 RTE 開發者日報 Vol.200OpenAI自動駕駛開發者日報
- 微軟開發者大會推出 60 個新發布;阿里雲和百度加入大模型「價格戰」丨 RTE 開發者日報 Vol.209微軟阿里大模型開發者日報
- ChatGPT 向更多使用者推出高階語音模式:支援 50 種語言;位元組釋出兩款新影片生成大模型丨 RTE 開發者日報ChatGPT模式大模型開發者日報
- OpenAI 釋出全新生成式模型 GPT-4o;位元組收購音訊裝置公司 Oladance 丨 RTE 開發者日報 Vol.203OpenAI模型GPT音訊開發者日報
- 位元組豆包釋出新模型,AI 一句話 P 圖;Google 正式推出 Vids,簡單提示即可生成影片演示丨 RTE 開發者日報模型AIGo開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- Swarm 框架登場:OpenAI 第 3 階段「敲門磚」;馬斯克的 Teslabot 實際有人遠端操控丨 RTE 開發者日報Swarm框架OpenAI馬斯克開發者日報
- Meta AR 眼鏡團隊前負責人加入 OpenAI;visionOS 2.2 Beta 引入超寬屏投屏模式丨 RTE 開發者日報OpenAI模式開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報