亞馬遜秘密研發 AI 對標 ChatGPT;語音 AI 未來五年或將釋放 100 億美元市場 丨 RTE 開發者日報

RTE开发者社区發表於2024-06-26

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。

我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@CY@JLT,@ 鮑勃

一、有話題的新聞

1、BVP 報告:語音 AI 應用將在未來五年內釋放 100 億美元的新軟體 TAM

近日,BVP 釋出了《State of the Cloud 2024》報告,並深入探討了塑造 AI 雲經濟未來的五大趨勢,以及對 2030 年前景的預測。

其中趨勢之一:多模態模型和 AI Agent 將改變人類與軟體的關係。

多模態模型和 AI Agent 的興起正在引領 AI 創新的下一波浪潮,並大大擴充套件了 AI 的潛在應用範圍,比早期基於文字的模型實現的應用要廣泛得多。對於 AI 企業家來說,在新的模態(如語音、影像和影片)以及 Agent 工作流中創新是一個全新的機會。這些新模態賦予了 AI 類似於人類的視覺、聽覺和語言能力,這為 AI 在依賴這些感官的大量人類工作中扮演輔助角色提供了機會。

在接下來的 12 個月裡, BVP 預計語音 AI 應用將出現爆發性增長。從長遠來看, BVP 還看到了以 Agent 為核心的產品有望改變企業運營方式,因為它們設定了 AI 可以處理的任務複雜性和廣度的新期望。

多模態模型和 AI Agent 將改變人類與軟體的關係,語音 AI 應用預計將在未來五年內釋放 100 億美元的新軟體 TAM。(@ 有新 Newin)

2、OpenAI 的 ChatGPT Mac 版應用已向所有使用者開放,支援語音對話

6 月 26 日訊息,OpenAI 公司宣佈,其首款適用於 Mac 的 ChatGPT 聊天機器人應用正式面向所有使用者開放下載。此前一個月,該應用一直處於測試階段,僅 Plus 付費訂閱使用者可以使用。

OpenAI 稱,ChatGPT 的 Mac 應用旨在與使用者日常操作無縫整合,其原生支援 Mac 系統,並提供方便的快捷鍵(Command + 空格鍵)允許使用者隨時隨地啟動應用。使用者可以輕鬆與聊天機器人進行互動,並可選擇將檔案、照片和螢幕截圖等附加到您的資訊中,供 ChatGPT 使用這些素材進行理解和創作。

該應用還支援「語音模式」,使用者可以使用語音與 ChatGPT 進行交流。OpenAI 表示,將在未來幾周內為 Mac 使用者提供支援 GPT-4o 功能的新「語音模式」版本。(@IT 之家)

3、曝亞馬遜秘密研發 AI 對標 ChatGPT,可制定度假行程、控制智慧家居裝置,甚至預訂航班

據外媒報導,科技巨頭亞馬遜正在秘密研發一款人工智慧聊天機器人,代號為「Metis」,目標直指 OpenAI 旗下的知名產品 ChatGPT。知情人士稱,這是亞馬遜此前釋出的「Titan」模型的升級版,功能更加強大。內部檔案顯示,Metis 能夠以一種智慧對話的方式回答文字和影像相關的問題,並提供相應的資訊來源連結,推薦後續查詢,甚至生成影像。

更重要的是,亞馬遜希望 Metis 能夠利用一種名為「檢索增強生成」(retrieval-augmented generation)的人工智慧技術,這將使其能夠獲取超出其訓練資料之外的資訊,從而生成最新的資訊。例如,Metis 能提供最新的股票價格,而一些不具備該技術的聊天機器人則無法做到這一點。Metis 不僅能作為資訊助手,還能勝任人工智慧代理人的角色。這意味著它可以根據現有資料自動執行復雜任務,比如制定度假行程、控制智慧家居裝置,甚至預訂航班。(@IT 之家)

4、美國大型唱片公司聯手起訴 AI 音樂生成器 Suno 和 Udio 侵犯版權

據外媒報導,三家主要的唱片公司索尼音樂、環球音樂和華納音樂本週一起訴人工智慧公司 Suno 和 Udio,指控它們透過使用這些唱片公司的錄音來訓練音樂生成式 AI 系統,犯下大規模版權侵權行為。訴訟中,三家唱片公司提到,Suno 和 Udio 在未經許可的情況下複製音樂,訓練他們的系統創作音樂,這些音樂將「直接與人類藝術家的作品競爭、貶值並最終淹沒」人類藝術家的作品。

對此唱片公司要求法院判處每首歌 15 萬美元的法定賠償金,並指控 Suno 複製了 662 首歌曲,Udio 複製了 1670 首。對此 Suno 執行長 Mikey Shulman 回應:「我們的技術具有變革性,它旨在生成全新的輸出,而不是記住和重複現有內容。」(@IT 之家)

5、Google 將推出明星網紅 AI 聊天機器人

據外媒 The Information 報導,Google 將推出明星網紅 AI 聊天機器人。有兩位知情人士表示,Google 將基於 Gemini 大語言模型,打造這款明星網紅 AI 聊天機器人。

Google 還在嘗試開發一項功能,讓使用者能夠以自定義的方式來建立自己的 AI 聊天機器人。

報導中指出,Google 的想法並不是首例,已經有 Character.ai、 Meta 等公司推出了類似的產品。(@ 愛範兒)

6、OpenAI API 國內不能用了,國產大模型紛紛推出「平替」搬家方案

6 月 25 日訊息,OpenAI 官方推送的郵件通知中指出,自 7 月 9 日起,OpenAI 將開始阻止來自非支援國家和地區的 API 流量。受影響組織若希望繼續使用 OpenAI 的服務,必須在其支援的國家或地區內訪問。

OpenAI 的這一禁令通知,讓國內一眾大模型廠商們都興奮起來,爭先恐後的推出了「搬家」服務——使用 OpenAI API 構建產品或服務的企業可以「無縫」將業務搬到自家大模型。百度智慧雲千帆宣佈推出「0 元遷移及 0 元服務等多項免費服務」、阿里雲百鍊表示將提供「最具價效比的中國大模型替代方案」、智譜宣佈「特別搬家計劃」、零一萬物宣佈「Yi API 二折平替計劃」、百川智慧宣佈推出「OpenAI 零成本遷移計劃」等等。(@TechWeb)

二、有態度的觀點

1、何小鵬:相信 2025 會是完全自動駕駛的 ChatGPT 時刻

6 月 25 日晚間訊息,小鵬汽車董事長何小鵬今日在微博上釋出在美體驗特斯拉 FSD 影片,稱小鵬智駕能跟特斯拉掰手腕。何小鵬表示,「在舊金山城區 Waymo 表現更好,而 FSD 在矽谷和高速表現極好,可以達到很高的分數,很多路況處理都很絲滑。」

小鵬自動駕駛負責人李力耘隨後在微博上表示,很期待 FSD 進入中國後的實際體驗,也很期待讓 XNGP 和 FSD 同臺比拼。

何小鵬還表示,非常感慨 FSD 在數月裡有很大的進步,小鵬也會向 FSD 學習他們優秀的功能點和使用者體驗部分,「我相信 2025 會是完全自動駕駛的 ChatGPT 時刻。」(@ 新浪科技)

寫在最後:

我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章