ElevenLabs Voice Design :可透過文字建立個性化語音;蘋果推出首個開發者測試版丨 RTE 開發者日報

RTE开发者社区發表於2024-10-24

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@ 鮑勃

01 有話題的新聞

1、蘋果推出 iOS 18.2 首個開發者測試版,Siri 接入 ChatGPT

今日,蘋果向 iPhone 15 Pro 及以上機型推送了 iOS 18.2 首個開發者測試版。新版本包括了更多的 Apple 智慧功能更新:

Image Playground:允許使用者使用提示詞生成圖片

Genmoji:允許使用者使用提示詞生成自定義的表情符號

Siri 接入 ChatGPT:Siri 現在可以把使用者的提問和請求移交給 ChatGPT。整合 ChatGPT 的 Siri 支援螢幕響應功能,使用者可以發出類似「這張照片中有什麼」的提問

視覺智慧:iPhone 16 系列機型支援,可以用於識別周圍的物體和地點,還能獲取 Google 搜尋結果和 ChatGPT 答案

寫作工具:重寫工具支援描述語氣和內容

語言更新:新增了對澳大利亞、加拿大、紐西蘭、南非和英國英語的支援

除了 Apple 智慧,iOS 18.2 還帶來了重新設計的郵件應用、更新的語音備忘錄、自定義預設應用等功能。(@ APPSO)

2、Runway 推出一鍵表情複製功能 Act-One

AI 影片生成平臺 Runway 釋出了全新工具「Act-One」,能夠在 Gen-3 Alpha 模型中生成富有表現力的角色表演影片。

據介紹,Act-One 可以使用影片和語音表演作為輸入源,可以用來進行真人演員的表情捕捉,能夠準確地將表演轉換為與原始影片比例不同的角色,而不需要傳統動作捕捉的大量裝置。

Act-One 也支援僅靠單個演員和攝像機,生成兩個不同的角色的多機位對話場景。(@ APPSO)

3、ElevenLabs 推出全新 AI 語音生成工具 Voice Design 可透過文字提示建立個性化語音

ElevenLabs 日前釋出全新 AI 語音生成工具 Voice Design,透過簡單的文字描述即可建立個性化語音,開創了 AI 配音領域的新紀元。

這款工具最大的特點是其直觀的文字提示功能。使用者只需描述所需聲音的特徵,如「溫暖友好的中年女性聲音,帶著輕微英國口音」,系統便能快速生成符合要求的語音。

Voice Design 支援調節多個語音引數,包括年齡、性別、口音、語調和音高等,確保生成的聲音精確匹配使用者需求。

除了模擬真實人聲,Voice Design 還突破性地支援創作角色化語音。無論是精靈的空靈之音,還是機器人的金屬音效,系統都能準確捕捉並還原這些虛擬角色的聲音特徵。使用者可以反覆調整引數,探索無限的創作可能,為遊戲開發、有聲內容製作等領域提供了強大的創意工具。(@ 站長之家)

4、OpenAI 聘請第一位首席經濟學家

TechCrunch 報導,OpenAI 聘請了第一位首席經濟學家:Aaron Chatterji,他曾為兩位美國總統服務,現任杜克大學商業與公共政策教授。

Chatterji 將為 OpenAI 研究人工智慧造成的經濟影響,並領導人工智慧如何影響經濟增長和就業前景的研究。

OpenAI 還任命了前助理副總檢察長和 Uber 的合規主管 Scott Schools 為新任首席合規官,將為這家公司就法律要求和道德規範方面進行合作。(@ APPSO)

5、JetBrains 為開發者打造最強 AI 助手 Mellum:為程式設計而生,延遲低、補全快、準確度高

JetBrains 公司於 10 月 22 日釋出博文,專門設計推出了全新的大語言模型 Mellum,為軟體開發者提供更快速、更智慧和更具上下文意識的程式碼補全。

官方表示 Mellum 相比較其它大語言模型,最大的亮點就是專門為開發者程式設計而設計的,具備延遲低、效能強、功能全面等優點,可以在最短時間內為開發者提供相關建議。

Mellum 已支援 Java、Kotlin、Python、Go 和 PHP 等流行程式語言,使用者可透過加入早期訪問計劃獲取更多語言支援。

Mellum 表示補全程式碼延遲時間是此前的三分之一,顯著提高了任務完成速度;完成建議的接受率約為 40%,成為行業內的可靠基準。

Mellum 不僅在速度和準確性上表現卓越,還深度整合 JetBrains IDE,讓其能夠提供符合專案需求的上下文程式碼建議。

JetBrains 承諾 Mellum 的訓練資料僅來自公開可用且具有寬鬆許可的程式碼,確保使用者隱私。(@IT 之家)

02 有態度的觀點

1、《人類簡史》作者尤瓦爾:我們需要防止人工智慧失控,確保其符合人類價值觀

「2024 ESG 全球領導者大會」於 10 月 16 日 -18 日在上海舉行。新浪財經歐洲站站長郝倩與知名歷史學家、哲學家、《人類簡史》、《智人之上》作者尤瓦爾・赫拉利展開對話。

尤瓦爾認為,人工智慧(AI)的崛起是人類所面臨的一大挑戰。但不可否認的是,人工智慧能夠造福人類的觀點同樣存在。在被問題及,在可持續發展的社會中,人工智慧應該扮演什麼角色時,尤瓦爾表示,如果能夠防止人工智慧失控,確保它能符合人類的價值觀,那麼人工智慧可能會成為人類歷史上最好的發明。

「因為到那時,它的巨大力量將服務於人類社會,而不是危害人類社會」,尤瓦爾舉例說,諸如醫療保健等領域,目前沒有足夠數量的醫生為病人服務,而人工智慧醫生可以在這方面提供巨大幫助。

談及人工智慧的監管問題,尤瓦爾強調,「監管非常重要,而且許多國家的政府對此很感興趣」。

他強調,禁止人工智慧假冒人類是一項重要規定。「我們歡迎人工智慧以醫生或教師的身份在社交媒體上與我們互動,但它絕不能假裝自己是人類。你在交談時,需要知道交談的物件是人類還是人工智慧。」

此外,同樣重要的是,人工智慧公司要對其演算法的行為負責。如果一家公司研發了一種功能強大的演算法,而它對社會、人類心理或其他方面產生了危險的副作用,那麼這家公司就必須承擔責任,必須對它造成的損害負責。(@IT 之家)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章