亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報
開發者朋友們大家好:
這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。
我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@ 鮑勃
一、有話題的新聞
1、BVP 報告:語音 AI 應用將在未來五年內釋放 100 億美元的新軟體 TAM
近日,BVP 釋出了《State of the Cloud 2024》報告,並深入探討了塑造 AI 雲經濟未來的五大趨勢,以及對 2030 年前景的預測。
其中趨勢之一:多模態模型和 AI Agent 將改變人類與軟體的關係。
多模態模型和 AI Agent 的興起正在引領 AI 創新的下一波浪潮,並大大擴充套件了 AI 的潛在應用範圍,比早期基於文字的模型實現的應用要廣泛得多。對於 AI 企業家來說,在新的模態(如語音、影像和影片)以及 Agent 工作流中創新是一個全新的機會。這些新模態賦予了 AI 類似於人類的視覺、聽覺和語言能力,這為 AI 在依賴這些感官的大量人類工作中扮演輔助角色提供了機會。
在接下來的 12 個月裡, BVP 預計語音 AI 應用將出現爆發性增長。從長遠來看, BVP 還看到了以 Agent 為核心的產品有望改變企業運營方式,因為它們設定了 AI 可以處理的任務複雜性和廣度的新期望。
多模態模型和 AI Agent 將改變人類與軟體的關係,語音 AI 應用預計將在未來五年內釋放 100 億美元的新軟體 TAM。(@ 有新 Newin)
2、OpenAI 的 ChatGPT Mac 版應用已向所有使用者開放,支援語音對話
6 月 26 日訊息,OpenAI 公司宣佈,其首款適用於 Mac 的 ChatGPT 聊天機器人應用正式面向所有使用者開放下載。此前一個月,該應用一直處於測試階段,僅 Plus 付費訂閱使用者可以使用。
OpenAI 稱,ChatGPT 的 Mac 應用旨在與使用者日常操作無縫整合,其原生支援 Mac 系統,並提供方便的快捷鍵(Command + 空格鍵)允許使用者隨時隨地啟動應用。使用者可以輕鬆與聊天機器人進行互動,並可選擇將檔案、照片和螢幕截圖等附加到您的資訊中,供 ChatGPT 使用這些素材進行理解和創作。
該應用還支援「語音模式」,使用者可以使用語音與 ChatGPT 進行交流。OpenAI 表示,將在未來幾周內為 Mac 使用者提供支援 GPT-4o 功能的新「語音模式」版本。(@IT 之家)
3、曝亞馬遜秘密研發 AI 對標 ChatGPT,可制定度假行程、控制智慧家居裝置,甚至預訂航班
據外媒報導,科技巨頭亞馬遜正在秘密研發一款人工智慧聊天機器人,代號為「Metis」,目標直指 OpenAI 旗下的知名產品 ChatGPT。知情人士稱,這是亞馬遜此前釋出的「Titan」模型的升級版,功能更加強大。內部檔案顯示,Metis 能夠以一種智慧對話的方式回答文字和影像相關的問題,並提供相應的資訊來源連結,推薦後續查詢,甚至生成影像。
更重要的是,亞馬遜希望 Metis 能夠利用一種名為「檢索增強生成」(retrieval-augmented generation)的人工智慧技術,這將使其能夠獲取超出其訓練資料之外的資訊,從而生成最新的資訊。例如,Metis 能提供最新的股票價格,而一些不具備該技術的聊天機器人則無法做到這一點。Metis 不僅能作為資訊助手,還能勝任人工智慧代理人的角色。這意味著它可以根據現有資料自動執行復雜任務,比如制定度假行程、控制智慧家居裝置,甚至預訂航班。(@IT 之家)
4、美國大型唱片公司聯手起訴 AI 音樂生成器 Suno 和 Udio 侵犯版權
據外媒報導,三家主要的唱片公司索尼音樂、環球音樂和華納音樂本週一起訴人工智慧公司 Suno 和 Udio,指控它們透過使用這些唱片公司的錄音來訓練音樂生成式 AI 系統,犯下大規模版權侵權行為。訴訟中,三家唱片公司提到,Suno 和 Udio 在未經許可的情況下複製音樂,訓練他們的系統創作音樂,這些音樂將「直接與人類藝術家的作品競爭、貶值並最終淹沒」人類藝術家的作品。
對此唱片公司要求法院判處每首歌 15 萬美元的法定賠償金,並指控 Suno 複製了 662 首歌曲,Udio 複製了 1670 首。對此 Suno 執行長 Mikey Shulman 回應:「我們的技術具有變革性,它旨在生成全新的輸出,而不是記住和重複現有內容。」(@IT 之家)
5、Google 將推出明星網紅 AI 聊天機器人
據外媒 The Information 報導,Google 將推出明星網紅 AI 聊天機器人。有兩位知情人士表示,Google 將基於 Gemini 大語言模型,打造這款明星網紅 AI 聊天機器人。
Google 還在嘗試開發一項功能,讓使用者能夠以自定義的方式來建立自己的 AI 聊天機器人。
報導中指出,Google 的想法並不是首例,已經有 Character.ai、 Meta 等公司推出了類似的產品。(@ 愛範兒)
6、OpenAI API 國內不能用了,國產大模型紛紛推出「平替」搬家方案
6 月 25 日訊息,OpenAI 官方推送的郵件通知中指出,自 7 月 9 日起,OpenAI 將開始阻止來自非支援國家和地區的 API 流量。受影響組織若希望繼續使用 OpenAI 的服務,必須在其支援的國家或地區內訪問。
OpenAI 的這一禁令通知,讓國內一眾大模型廠商們都興奮起來,爭先恐後的推出了「搬家」服務——使用 OpenAI API 構建產品或服務的企業可以「無縫」將業務搬到自家大模型。百度智慧雲千帆宣佈推出「0 元遷移及 0 元服務等多項免費服務」、阿里雲百鍊表示將提供「最具價效比的中國大模型替代方案」、智譜宣佈「特別搬家計劃」、零一萬物宣佈「Yi API 二折平替計劃」、百川智慧宣佈推出「OpenAI 零成本遷移計劃」等等。(@TechWeb)
二、有態度的觀點
1、何小鵬:相信 2025 會是完全自動駕駛的 ChatGPT 時刻
6 月 25 日晚間訊息,小鵬汽車董事長何小鵬今日在微博上釋出在美體驗特斯拉 FSD 影片,稱小鵬智駕能跟特斯拉掰手腕。何小鵬表示,「在舊金山城區 Waymo 表現更好,而 FSD 在矽谷和高速表現極好,可以達到很高的分數,很多路況處理都很絲滑。」
小鵬自動駕駛負責人李力耘隨後在微博上表示,很期待 FSD 進入中國後的實際體驗,也很期待讓 XNGP 和 FSD 同臺比拼。
何小鵬還表示,非常感慨 FSD 在數月裡有很大的進步,小鵬也會向 FSD 學習他們優秀的功能點和使用者體驗部分,「我相信 2025 會是完全自動駕駛的 ChatGPT 時刻。」(@ 新浪科技)
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- Runway 新增影片擴充套件畫面功能;Anthropic 再獲亞馬遜投資 40 億美元,聚焦 AI 晶片研發丨 RTE 開發者日報套件亞馬遜AI晶片開發者日報
- ChatGPT 訂閱價或漲到 44 美元;研究稱 AI 可 100% 繞過 reCAPTCHA V2 驗證丨 RTE 開發者日報ChatGPTAIAPT開發者日報
- 語音生成模型 PlayDialog:可生成對話播客、旁白;小米 AI 眼鏡將於明年 Q2 釋出丨 RTE 開發者日報模型AI開發者日報
- Meta 研發大型 AI 推薦引擎;全球首部全面監管 AI 法規將落地丨 RTE 開發者日報 Vol.160AI開發者日報
- 基於 Groq 和 Cartesia 的高速 AI 語音助手釋出;xAI 將自行打造超級計算機丨 RTE 開發者日報AI計算機開發者日報
- AI 口語學習應用 Speak 新一輪融資估值 10 億美元;YouTube 推出 AI 多語言配音丨 RTE 開發者日報AI開發者日報
- 語音助手市場來勢洶洶,亞馬遜Alexa 2019將會如何應對?亞馬遜
- ChatGPT 即將登陸 iPhone;史丹佛推出 AI 輔助全息成像技術丨 RTE 開發者日報 Vol.202ChatGPTiPhoneAI開發者日報
- 微軟將深度整合 Azure AI 與 GitHub;Stability AI 0.5 秒生成三維建模丨 RTE 開發者日報微軟AIGithub開發者日報
- 開發者實踐丨Agora Home AI 音視訊的未來GoAI
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- ChatGPT 開啟「眼睛」,實時攝像頭對話來了;崑崙萬維推出實時語音助手 Skyo 丨 RTE 開發者日報ChatGPT開發者日報
- ChatGPT 開啟「眼睛」,實時攝像頭對話來了;崑崙萬維推出實時語音助手 Skyo丨 RTE 開發者日報ChatGPT開發者日報
- 馬斯克的 xAI 融資 60 億美元;英偉達收購兩家 AI 創企丨 RTE 開發者日報 Vol.193馬斯克AI開發者日報
- 上海交大開源超逼真聲音克隆 TTS;微軟探索音生圖 AI 模型丨 RTE 開發者日報TTS微軟AI模型開發者日報
- 亞馬遜雲集齊 Claude 3 全家桶;世界數字技術院釋出大模型安全國際標準丨 RTE 開發者日報 Vol.187亞馬遜大模型開發者日報
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 市場規模超 60 億美元,語音如何改變對話式 AI?AI
- 斯嘉麗·約翰遜指控 OpenAI 非法使用其聲音;微軟推出 AI 工具「回顧」(Recall)丨 RTE 開發者日報 Vol.208OpenAI微軟開發者日報
- ChatGPT 向更多使用者推出高階語音模式:支援 50 種語言;位元組釋出兩款新影片生成大模型丨 RTE 開發者日報ChatGPT模式大模型開發者日報
- Neuralink 將啟動第二例人類腦機晶片植入;多項 Claude 3.5 Sonnet AI 工具釋出丨 RTE 開發者日報晶片AI開發者日報
- Hume AI 語音控制功能:建立個性化語音;李飛飛空間智慧首個模型:單圖生成 3D 互動場景丨 RTE 開發者日報AI模型3D開發者日報
- 首個實時 AI 影片生成技術釋出;科大訊飛釋出星火大模型 4.0 丨 RTE 開發者日報AI大模型開發者日報
- Sam Altman 新公司將打造 AI 健康教練;全新大模型架構 TTT 超越 Transformer 丨 RTE 開發者日報AI大模型架構ORM開發者日報
- 星紀魅族宣佈 All in AI;歐盟將首次對蘋果處以罰款丨 RTE 開發者日報 Vol.146AI蘋果開發者日報
- 微軟或開發新模型與 OpenAI 競爭;蘋果或將推出 Apple Pencil Pro 丨 RTE 開發者日報 Vol.198微軟模型OpenAI蘋果APP開發者日報
- 語音 AI 迎來爆發期,也仍然隱藏著被低估的機會丨 RTE2024 音訊技術和 Voice AI 專場AI音訊
- 新 Chrome 外掛可檢測 AI 偽造聲音;Canary Speech 推出用於臨床對話的語音分析技術丨 RTE 開發者日報ChromeAI開發者日報
- 新官宣!投資高達40億美元!亞馬遜雲科技助力Anthropic未來基礎模型開發亞馬遜模型
- ChatGPT 支援語音實時搜尋;Meta Ray-Ban 智慧眼鏡新增影片識別與實時語音翻譯功能丨 RTE 開發者日報ChatGPT開發者日報
- 摺疊 MacBook 價格或比肩 Vision Pro;必應全球當機波及 ChatGPT 丨 RTE 開發者日報 Vol.211MacChatGPT開發者日報
- 影片生成模型 Dream Machine 開放試用;微軟將停止 Copilot GPTs 丨 RTE 開發者日報 Vol.224模型Mac微軟GPT開發者日報
- 微軟預計年底實現實時語音介面;矽基智慧開源 AI 數字人互動平臺 Duix 丨 RTE 開發者日報微軟AIUI開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報AI3D開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨RTE 開發者日報AI3D開發者日報
- 毛骨悚然,亞馬遜AI突然笑出聲來亞馬遜AI
- 蘋果開源高效語言模型 OpenELM;全球首個 AI 基因編輯器開源丨 RTE 開發者日報 Vol.192蘋果模型AI開發者日報
- 《金融時報》:2017年華為研發支出138億美元 僅次於亞馬遜和谷歌亞馬遜谷歌