Hume.ai 升級:自研情感模型整合 Claude 和 Fal;數字嗅覺公司 Osmo 用 AI 實現氣味「傳送」

RTE开发者社区發表於2024-11-05

開發者朋友們大家好:

這裡是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement) 領域內「有話題的 新聞 」、「有態度的 觀點 」、「有意思的 資料 」、「有思考的 文章 」、「有看點的 會議 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@SSN,@鮑勃

01 有話題的新聞

1、訊息稱馬斯克正與英偉達就 xAI 投資事宜進行談判

據 New York Post 報導,知情人士稱,晶片巨頭英偉達正在與埃隆・馬斯克就對 xAI 的潛在投資進行談判。

xAI 是馬斯克創立的人工智慧公司,其開發的大語言模型 Grok 目前已部署在社交媒體平臺 X 上。雖然 Grok 的推出時間晚於 OpenAI 的 ChatGPT 等競爭對手,但其增長和發展速度非常快。

儘管英偉達尚未就潛在投資 xAI 一事置評,但其執行長黃仁勳一直非常支援馬斯克的人工智慧初創公司。在 10 月份的一次採訪中,黃仁勳指出,xAI 團隊僅用 19 天就建立了一個擁有 10 萬個 H200 Blackwell GPU 的超級計算機叢集。黃仁勳表示,這樣的專案通常從概念階段到最終產出需要四年的時間。「據我所知,世界上只有一個人能做到這一點;埃隆對工程、建設、大型系統和資源調配的理解是獨一無二的,這簡直令人難以置信。」黃仁勳指出。(@IT 之家)

2、遠端 「聞」 香,數字嗅覺公司 Osmo 用 AI 技術實現氣味「傳送」

一家名為 Osmo 的「數字嗅覺」公司宣佈,已成功利用 AI 技術分析一個位置的氣味,並在無需人工干預的情況下在其他地方複製它。

氣味隱形傳態使用感測器收集氣味,並透過氣相色譜質譜儀 (GC / MS) 進行分析。然後,資料被傳輸到專門的分子印表機,它可以合成和組合精確再現氣味所需的化學物質。Osmo 之前曾進行過氣味隱形傳送,不過需要人工幫助,如今利用 AI 實現了自動化。

據介紹,Osmo 已成功利用 AI 將處理後的氣味對映到其主要氣味圖(POM)上,該資料庫可預測分子的特定組合如何與特定氣味相對應。然後,AI 模型可以將氣味的分子特徵傳達給機器人系統,以建立和混合香氣的複製品。
該公司已成功利用 AI 合成了「新鮮的夏季李子」氣味,Osmo 執行長 Alex Wiltschko 在 10 月 30 日宣佈了這一訊息。(@IT 之家)

3、位元組跳動內測新款 AI 模型分享社群——「爐米 Lumi」亮相

位元組跳動近日悄然上線了一款名為「爐米 Lumi」的 AI 模型交流社群,該社群集模型分享、Workflow 構建及 LoRA 訓練等多元化功能於一身。在這個平臺上,使用者不僅可以展示自己研發的 AI 模型,還能與其他同好進行深入交流,共同搭建完善的 AI 工作流程。

儘管「爐米 Lumi」當前仍處於內測階段,並未在主流搜尋引擎中公開露面,但已有部分使用者透過特定網址「artistrylab.net」探尋到了這個神秘社群的蹤跡。不過,嘗試訪問的使用者可能會遇到掃碼登入後提示無許可權的情況,顯示該平臺仍在嚴謹地控制訪問許可權。

據悉,「爐米 Lumi」社群為 AI 愛好者們提供了一個全新的互動空間。在這裡,他們可以自由地分享自己的 AI 創作,探索模型的無限可能,並藉助社群的力量不斷最佳化和完善自己的作品。同時,該平臺還提供了豐富的工具和資源,幫助使用者更高效地進行 AI 模型的開發和訓練。(@極客公園)

4、顛覆影片編輯!開源神器 ComfyUI-MochiEdit 支援影片轉影片,區域性編輯

像操控文字一樣編輯影片的情景一般都出現在人們的想象裡,現在這個想法已經成為現實。

ComfyUI-MochiEdit 是一款基於 ComfyUI 和 Genmo Mochi 的開源影片編輯工具,它提供了一種全新的影片編輯思路:將影片轉換為噪聲,再透過目標提示重新取樣噪聲,生成全新影片。這種方法實現了區域性編輯和影片轉影片功能,讓使用者可以輕鬆修改影片的部分而無需處理整個影片。(@AIbase 基地)

5、Hume App 全新升級:EVI 2 語音技術引領 AI 助手新體驗

多功能 AI 助手平臺, 提供個性化的語音互動體驗, 覆蓋從快速問答到深度諮詢的全方位服務

技術亮點

  • A. 自研核心 - EVI 2 語音語言模型

-可獨立生成語言內容

-為 AI 助手提供獨特聲音和個性

-具備情感化表達能力

-能將其他 LLM 的文字響應轉化為富有表現力的對話

  • B. 技術整合

-Anthropic Claude 系列模型(3.5 Haiku 和 Sonnet 版本)

-網路搜尋能力

-fal 的影像生成技術

功能場景劃分

- A. 快速問答

-技術組合:EVI 2 + Claude 3.5 Haiku + 網路搜尋

-特點:實時性強, 響應快速準確

  • B. 故事講述

-技術組合:純 EVI 2 + fal 影像生成

-特點:注重情感表達和戲劇化效果

-配合影像增強敘事體驗

  • C. 深度對話與生活建議

-技術組合:EVI 2 + Claude 3.5 Sonnet + 網路搜尋

-特點:提供更深度的思考和建議

  • D. 情感支援

-貫穿各個場景的基礎功能

-透過 EVI 2 的表達能力提供情感共鳴

Hume App:
http://app.hume.ai

Developer:
https://platform.hume.ai(@ Mengshao@X)

02 有態度的觀點

1、微軟 AI 負責人:情商對 AI 來說也很重要

微軟 AI 部門的執行長 Mustafa Suleyman 在最近的一場對談活動中,談到了他對於 AI 技術的不少見解。

Suleyman 曾經也是 AI 初創公司 Pi 的聯合創始人,這家公司強調「人性化」的 AI 產品。主持人就此向 Suleyman 提問,對於 AI 技術來說,情商意味著什麼?

Suleyman 回答稱,研究人員在不斷推進 AI 的「智商」進步,卻往往忽略了同樣重要的資訊傳達方式。Suleyman 認為僅僅只是把事實列出是一個非常「書呆子」的事情。

AI 模型的語氣、風格、情商,以及對特定語氣的特別反饋,在 Suleyman 眼中,比維基百科式單純羅列客觀事實,對消費者來說更重要。

Suleyman 對未來如何設計 AI 的個性非常感興趣,認為這才是人們真正會發現價值的東西。(@ APPSO)

寫在最後:

我們歡迎更多的小夥伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章