ElevenLabs X-to-Voice:社交賬號自動生成能說話的個人頁面;OpenAI 正式推出 ChatGPT 搜尋

RTE开发者社区發表於2024-11-01

開發者朋友們大家好:

這裡是 「RTE 開發者日報」 ,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@鮑勃

01有話題的新聞

1、OpenAI 正式推出 ChatGPT 搜尋

今天凌晨,OpenAI 宣佈開放 ChatGPT 機器人中整合的全新搜尋功能。當使用者與 ChatGPT 互動時,聊天機器人會根據使用者的需求自主決定是否進行網路搜尋以提供更多更新的資訊,使用者也可以手動觸發搜尋功能。據介紹,搜尋功能的底層模型是 ChatGPT-4o 微調版本。這個功能曾在今年 7 月以「SearchGPT」的原型向 10000 名測試使用者推出。ChatGPT Plus 和 Team 訂閱使用者現在即可使用搜尋功能,未來幾周將向教育和企業使用者開放,而免費使用者還需要等待幾個月的時間。OpenAI 也官宣了和多家新聞媒體的合作,包括美聯社、路透社、《時代》雜誌等多家媒體,這些合作伙伴可以選擇對 ChatGPT 開放自己的內容,以出現在搜尋結果中。(@APPSO)

2、D-ID 推超逼真 AI 虛擬頭像:進行影片訓練就能復刻頭部和軀幹動作

人工智慧影片平臺 D-ID 今日宣佈推出兩款新型虛擬頭像 ——Express 和 Premium+,旨在提升內容創作的質量和效率。Express 頭像的訓練時間僅需約一分鐘的影片,能夠在使用者講話時複製其頭部動作。而 Premium + 則是公司的旗艦模型,需要至少幾分鐘的錄製,以生成可以在影片中展示手部和軀幹動作的 AI 頭像。D-ID 的目標是透過增加手部和軀幹的動作,使虛擬頭像在與使用者互動時更加自然和真實。D-ID 表示,Premium + 模型具備實時互動能力,特別適合用於網路研討會和翻譯等應用場景。公司計劃將這些虛擬頭像應用於企業領域,包括生成銷售線索、提升客戶互動和個性化營銷活動。D-ID 執行長吉爾・佩裡在接受《科技 Crunch》採訪時表示:「我們相信與 AI 模型面對面互動是最佳方式,因此我們正在建立這些超逼真的虛擬頭像和自然的使用者介面。」 他還強調,商業人士將會創造自己的數字頭像,並且 D-ID 希望這些頭像在安全和隱私方面得到良好保障,避免技術被用於誤導他人。D-ID 還提到,個性化影片活動的效果顯著,可以使點選率提高 30%,轉化率提升 35%。(@AIbase 基地)

3、Meta 重磅釋出!MobileLLM 模型全面開放,研究人員免費獲取!

Meta 近日宣佈,其 MobileLLM 模型現已向研究人員開放,使用者可在 Hugging Face 平臺上免費下載並使用這些模型,這些模型已與 Transformers 庫全面整合。這一舉措旨在推動移動裝置上的大型語言模型(LLM)的研究和開發,為開發者和學術界提供更廣泛的工具與資源。MobileLLM 是 Meta 在移動 AI 領域的重要進展。它的推出標誌著 Meta 在降低大型語言模型使用門檻方面的重要一步。這些模型能夠在移動裝置上執行,使得開發者能夠在更廣泛的應用場景中利用 AI 技術。研究人員現在可以直接在自己的專案中測試和整合這些模型,從而推動新技術的創新。隨著 AI 技術的不斷進步,特別是在自然語言處理領域,大型語言模型在多個行業中顯示出了巨大的潛力。然而,如何將這些技術有效地應用於實際問題仍是一個挑戰。Meta 透過提供完整的模型權重,為研究者解決了這一難題,使得他們可以在自己的應用場景中進行定製化的實驗。(@AIbase 基地)

4、繼 ChatGPT 後,Anthropic 旗下 Claude AI 推出桌面平臺客戶端

繼 ChatGPT 後,目前又有一款海外流行的人工智慧 Claude AI 獲得了桌面版客戶端,目前相關客戶端處於測試狀態,支援 Windows / macOS / iOS 平臺。開發商 Anthropic 在 X 平臺官宣了這一訊息,同時透露使用者可以使用熱鍵快速喚起客戶端介面,不過 Claude AI 客戶端定位 AI 搜尋引擎,與 OpenAI 的 ChatGPT 客戶端聊天有所差異。參考應用詳情頁,這一 AI 客戶端主打語音搜尋,不過使用者也可以令其寫作文章郵件、解決數學問題、判斷語法錯誤、分析文件內容等。(@IT 之家)

5、X-to-Voice:輸入你的 Twitter 賬號名稱 自動生成能說話的個人資料頭像

使用者可以輸入 Twitter 賬號名稱,系統將分析其資料資料生成特有的語音和動畫頭像。主要功能個性化聲音生成:使用 ElevenLabs 的聲音設計 API,根據使用者的 Twitter 資料生成專屬的聲音配置,使每位使用者擁有獨特的聲音特點。動態頭像建立:使用 Taedra 工具,基於使用者的社交資料生成與聲音匹配的動畫頭像,使虛擬形象更加生動。資料分析與定製:使用者輸入 Twitter 賬號後,系統會分析該賬號的資料資料,提取資訊並生成聲音和頭像配置,讓使用者的線上形象更具個性。簡易操作流程:使用者只需輸入 Twitter 賬號並點選「分析」按鈕,系統會在約一分鐘內完成分析和生成步驟,提供即刻體驗。分享與展示:生成的聲音和頭像可以分享至社交媒體,方便使用者展示個性化的虛擬形象和聲音。(@小互 AI)

02有態度的觀點

1、Runway CEO:不要去成為一家 AI 公司

AI 影片生成公司 Runway CEO Cristóbal Valenzuela 釋出了一封公開信,討論了 AI 公司的未來。Valenzuela 認為,屬於 AI 公司的時代已經結束了,但這並不是說 AI 失敗了,而是因為 AI 正在成為像電力或網際網路一樣的基礎設施。在 2024 年稱自己為 AI 公司,和自稱網際網路公司一樣過時。AI 不是終極目標,而是一種工具,是支撐更偉大成就的地基,這也是 Runway 的願景:AI 是講故事的必備工具。真正的革新不是技術本身,而是技術能實現的事物:全新的表達和講故事方式,以及連線人類經驗的新方法。(@APPSO)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章