Product Hunt 金喵獎 Voice AI 專案一覽;AI 招聘平臺 Mercor 再融資,估值 20 億美元 丨日報

RTE开发者社区發表於2025-02-24

開發者朋友們大家好:

這裡是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 技術 」、「有亮點的 產品 」、「有思考的 文章 」、「有態度的 觀點 」、「有看點的 活動 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。

本期編輯:@qqq、@ 鮑勃

01 創業眾籌|社群專案推薦

1、從網癮少年到融資百萬:我被一隻球藻改變的人生!

十年前的你在做些什麼呢

十年前有一位少年

把做作業的檯燈讓給了球藻

因為這顆綠球球

從此走上了創業的道路

“這一顆綠球球,

至少 三次改變了我的人生軌跡。

總能在我覺得山窮水盡的時候,

默默發光,

帶給我希望。”

十年後這顆綠球球帶來的 AI 陪伴軟體

——「來萌 APP」

因為資金問題無法迭代

目前正在發起眾籌...

這個曾經的少年叫萬一,他說:「2024 年的夏天結束時,我們迴歸「陪伴與治癒」的核心。我給這個為 EMO 青年 做的 APP,取名 來萌 LIMO。我體驗過市面上的所有 AI 陪伴軟體,都很 生硬 。他們像一個個沒有新故事的 NPC,死板地討好你。我發現,不論 AI 角色,還是遊戲和動漫的 IP,一個角色是否鮮活,都來自 創作者是否用心 。我 不想做 一隻順從你,永遠正確,沒有變化的 NPC 寵物。球藻君應該是一個有自己個性和生活的 AI 夥伴。你依賴他,他也依賴你。 我突然有信心了,球藻君或許能成為 AI 界一個不一樣的存在。我能做出那些 技術宅們 想不出的東西!」
(@ 球藻君 MOLI)

👉眾籌活動完整介紹

02 有話題的技術

1、清華團隊構建大型社會模擬器 AgentSociety ,可精確模擬社會輿論傳播、公眾政策響應等社會現象

清華團隊開源了一個"人工社會"模擬系統:AgentSociety,它把 LLM 與傳統社會行為理論結合,能真實的模擬人類行為及社會互動可以用來研究人類社會行為、模擬城市環境中的社會互動,測試各種社會場景和政策效果等。它整合了 LLM 的規劃、記憶和推理能力,可以生成真實的行為模擬,支援馬斯洛需求層次等理論模型,支援多種環境型別,基於資料集的、文字的或規則的,可以模擬不同程度的真實性和互動性

框架架構

  • 模型層,負責智慧體配置和任務管理

  • 智慧體層,管理記憶、決策和行動

  • 訊息層,處理智慧體之間的通訊

  • 環境層,管理智慧體與環境的互動

  • LLM 層,整合大語言模型,OpenAI、Qwen 等

  • 工具層,提供字串處理、結果分析、資料儲存和檢索等各種實用工具

為了降低智慧體間通訊的系統開銷,團隊引入了智慧體分組(Agent Group)機制,使多個智慧體可以在單個程序中執行,從而減少程序間通訊開銷,提高計算效率。此外,為了實現大規模社會智慧體的高併發、可靠訊息傳輸,團隊引入了 MQTT 通訊協議,該協議廣泛應用於物聯網場景,具備高吞吐量和低延遲的特點,非常適用於大規模社會模擬中智慧體間的資訊交換。(@AIGCLINK@X、AIGC 開放社群)

2、月之暗面 Kimi 開源 MoE 模型

2 月 23 日,月之暗面釋出最新論文《Muon is Scalable for LLM Training》,並首次開源了 MoE(混合專家)模型 Moonlight-16B-A3B,論文顯示,月之暗面透過深度改造 Muon 最佳化器,並將其運用於實際訓練,證明了 Muon 在更大規模訓練中的有效性,是 AdamW 訓練效率的 2 倍,且模型效能相當。據悉,本次論文所使用的模型為 Moonlight-16B-A3B,總引數量為 15.29B,啟用引數為 2.24B,其使用 Muon 最佳化器,在 5.7T Tokens 的訓練資料下獲得上述成績。目前,論文及 Moonlight-16B-A3B 相關內容已上架 Github 和 HuggingFace。(@APPSO)

03 有亮點的產品

1、中科聞歌釋出智川 X-Agent 平臺、優雅音影片大模型更新,領先技術加速 AI 普惠落地

2 月 22 日,中科聞歌 2025 AI 新產品線上釋出會成功舉辦,升級釋出「智川」企業智慧體平臺 1.0 與「優雅」音影片大模型平臺 1.5,助力政企極速落地 AI 應用與創意靈感,讓 AI 技術精細化滿足真實業務場景,加速 AI 普惠落地。

智川 X-Agent:一站式企業智慧體開發平臺,個性化 AI 應用極速落地

核心功能

  • 零程式碼 AI 應用搭建,10 秒定義專屬智慧體

  • 10+ 先進大模型隨心配,能力邊界盡在掌控

  • 視覺化工作流編排,解鎖 AI 應用無限可能

  • 知識庫自主管理,私域知識高效利用

  • 支援建立自定義外掛,智慧體技能無限擴充套件

  • 視覺化運營,知識反哺自我進化

  • 優雅平臺:多模態內容智慧生成平臺,讓你的靈感「優雅」實現

亮點功能

  • 長影片一鍵拆分智慧體,短影片批次速成

  • 一鍵成片智慧體,語義級別畫面匹配

  • 多語種影片翻譯智慧體,國際傳播更高效

  • 記者採寫智慧體,分鐘級實現原創首發

  • 智慧體廣場,靈活快速構建 AI 應用

  • 豐富 AI 工具集,滿足多樣創意需求(@ 量子位)

2、00 後創辦的 AI 招聘,融資 1 億美元,估值 20 億美元

Mercor,由三位 21 歲的 Thiel Fellows 創辦的人工智慧招聘初創公司,已在 B 輪融資中籌集了 1 億美元,公司向 TechCrunch 確認了這一訊息。

這一輪融資使得執行長 Brendan Foody、技術長 Adarsh Hiremath 和營運長 Surya Midha 成為一些最年輕的十億美元初創公司的創始人。這家成立兩年的平臺,擁有彼得·蒂爾、傑克·多爾西和亞當·丹吉洛等投資者,表示最新的融資將幫助「加速其將數十億人與他們的使命匹配的能力,充分發揮人類才能的潛力。」

成立於 2023 年,Mercor 利用人工智慧簡化招聘。 其平臺自動化簡歷篩選、候選人匹配,提供人工智慧驅動的面試和薪資管理。僱主上傳職位描述,Mercor 的系統推薦最佳候選人。

Mercor 聲稱其自動化系統不僅簡化了招聘流程,還消除了過程中的偏見。該宣告聲稱,人工智慧系統的偏見程度低於人類,這一說法並不總是成立。儘管如此,像 OpenAI 這樣的科技公司已經在使用 Mercor 的自動化工具,該公司聲稱這些工具能夠找到比其他人類更優秀的人選。

求職者完成一個 20 分鐘的 AI 面試,評估他們的技能並建立個人檔案。該平臺隨後將他們與相關的全職、兼職或小時工職位匹配。

Mercor 最初專注於招聘軟體工程師和技術專業人員,涉及運營、內容創作、產品開發和設計 。Foody 表示,軟體工程師仍然是 Mercor 目前最受歡迎的人才。但人工智慧實驗室越來越多地尋求其他專業人士——顧問、博士、銀行家、醫生和律師。(@Z Potentials)

3、全球產品界的奧斯卡,Product Hunt 2024 年金喵獎揭曉,眾多華人 AI 產品上榜

Product Hunt 的 Golden Kitty Awards(金喵獎)是每年一度的全球新產品評選盛典,旨在表彰當年最具創新性、影響力和使用者歡迎度的產品。該獎項透過社群投票和專家評審綜合選出覆蓋科技、工具、硬體等領域的年度最佳產品(如 ChatGPT、Figma 等曾獲獎),其名人堂記錄歷屆獲獎作品,成為行業趨勢風向標和創業者的榮譽殿堂。以下為 AI 硬體和音訊類目中的一些產品:

(1)Friend :一款旨在陪伴使用者、對抗孤獨的 AI 穿戴裝置。

(圖片來源:Product Hunt)

https://friend.com/wearable/index.html

Friend 定位為一款旨在提供陪伴的 AI 穿戴裝置,其核心價值主張是透過技術手段緩解孤獨感。目標使用者是需要情感支援、尋求陪伴的人群。該產品解決了現代社會日益嚴重的孤獨問題,透過 AI 技術提供一種新型的情感連線方式。隨著社會隔離現象的加劇,情感陪伴型 AI 產品具有廣闊的市場需求。

Friend 的核心功能亮點在於其陪伴功能,但具體細節未充分展示。其差異化優勢在於明確針對情感需求設計,有別於傳統智慧穿戴裝置。使用者體驗方面,產品設計理念著重於提供友好的陪伴,但具體實現和體驗效果需進一步瞭解。Friend 旨在透過 AI 技術提供情感支援,為使用者提供一種新型的陪伴方式,具有一定的社會價值和市場潛力。(@Z Potentials)

(2)ElevenLabs :一款先進的文字轉語音和語音克隆 AI 平臺

(圖片來源:Product Hunt)

https://elevenlabs.io/

ElevenLabs 定位為一款先進的 AI 語音平臺,其核心價值主張是提供逼真且情感豐富的文字轉語音服務,並支援語音克隆技術。目標使用者是內容創作者、遊戲開發者、電影製作人以及任何需要高質量語音解決方案的個人和企業。該產品解決了傳統語音合成技術不夠自然、缺乏情感的痛點,為使用者提供了更具表現力和個性化的語音體驗。隨著數字內容創作的蓬勃發展,ElevenLabs 具有廣闊的市場機會。

ElevenLabs 的核心功能亮點包括逼真的文字轉語音、語音克隆和語音定製。其差異化優勢在於其高質量的語音合成效果,能夠模仿人類語音的細微差別和情感,以及其強大的語音克隆技術。(@Z Potentials)

(3)Voicenotes :一款智慧 AI 筆記應用

(圖片來源:Product Hunt)

https://voicenotes.com/

Voicenotes 定位為一款智慧筆記應用,其核心價值主張是透過 AI 技術簡化筆記流程,並提供強大的資訊回顧和整理能力。目標使用者是需要高效記錄、整理和回顧資訊的知識工作者、學生、記者等。該產品解決了傳統筆記方式效率低、資訊難以回顧的痛點,提供了一種更便捷、智慧的筆記解決方案。在資訊爆炸的時代,高效的資訊管理工具具有巨大的市場需求,Voicenotes 具有廣闊的市場機會。

Voicenotes 的核心功能亮點包括語音轉錄、AI 問答和內容重組。其差異化優勢在於其智慧化的 AI 分析能力,可以對筆記內容進行總結、提取要點,甚至生成部落格文章草稿。使用者體驗方面,Voicenotes 操作簡單,介面直觀,並且支援多平臺使用,使用者可以隨時隨地記錄和回顧資訊。(@Z Potentials)

(4)Vapi:一款為開發者提供語音 AI 基礎設施的平臺。

(圖片來源:Product Hunt)

https://vapi.ai/

Vapi 定位為面向開發者的語音 AI 基礎設施平臺,其核心價值主張是簡化語音機器人的開發流程,讓開發者能夠在幾分鐘內構建、測試和部署語音應用。目標使用者是希望在自己的產品中整合語音 AI 功能的開發者和企業。該產品解決了傳統語音機器人開發週期長、成本高的痛點,為使用者提供了一種更快速、便捷的解決方案。隨著語音 AI 技術的普及,Vapi 具有廣闊的市場機會。

Vapi 的核心功能亮點包括簡化的開發流程、靈活的定製選項和強大的客戶支援。其差異化優勢在於其易用性,以及對各種 LLM/STT/TTS 模型、Web SDK 的支援。(@Z Potentials)

(5)GPT-4o :OpenAI 推出的多模態 AI 模型

(圖片來源:Product Hunt)

https://openai.com/index/hello-gpt-4o/

GPT-4o 定位為 OpenAI 的最新一代多模態 AI 模型,其核心價值主張是實現更自然、更流暢的人機互動,支援文字、語音和視覺輸入。目標使用者是開發者、企業和普通使用者,他們希望利用先進的 AI 技術來構建各種應用,例如聊天機器人、虛擬助手和內容創作工具。該產品旨在解決傳統 AI 模型在處理多模態輸入方面的侷限性,並提供更接近人類的互動體驗。隨著 AI 技術的不斷發展,對多模態 AI 模型的需求日益增長,GPT-4o 具有廣闊的市場機會。

GPT-4o 的核心功能亮點包括多模態輸入支援、實時語音互動和增強的推理能力。其差異化優勢在於其對多種模態的無縫整合,以及其在語音互動方面的顯著改進。(@Z Potentials)

(6)Earth.fm :一款提供純淨自然聲景的非營利應用,類似 Spotify,但專注於自然聲音

(圖片來源:Product Hunt)

https://earth.fm/app/

Earth.fm 定位為一款非營利的自然聲景應用,其核心價值主張是提供高質量、純淨的自然聲音,幫助使用者放鬆身心、連線自然。目標使用者是喜愛大自然、需要放鬆減壓、以及對冥想和心理健康有需求的人群。該產品旨在解決城市生活噪音汙染、人們難以接觸自然的問題,提供一種隨時隨地沉浸於自然的方式。隨著人們對心理健康的日益重視,以及對自然環境的嚮往,Earth.fm 具有廣闊的市場機會。

Earth.fm 的核心功能亮點包括 900+ 自然聲景、聲音地圖和離線播放。其差異化優勢在於其非營利性質、高質量的聲音資源,以及對環境保護的支援。使用者體驗方面,Earth.fm 應用介面簡潔,易於使用,並且提供多種分類和播放選項,使用者可以根據自己的喜好選擇不同的自然聲景。(@Z Potentials)

(7)Airchat :一款社交語音對講應用

(圖片來源:Product Hunt)

https://air.chat/

Airchat 定位為一款社交語音對講應用,其核心價值主張是提供便捷的語音交流體驗,讓使用者隨時隨地與他人進行語音對話。目標使用者是對語音交流感興趣,並希望尋找新的社交方式的人群。該產品旨在解決傳統社交媒體文字交流效率低、缺乏情感的痛點,提供一種更直接、更生動的交流方式。

Airchat 的核心功能是語音對講,使用者可以隨時發起或加入語音訊道。其差異化優勢在於其語音交流的特性,以及 '社交語音對講' 的概念。(@Z Potentials)

04 有態度的觀點

1、英偉達 CEO 黃仁勳首度回應 DeepSeek 衝擊:「對英偉達來說是一件好事」

在近日舉辦的 Beyond Artificial 大會上,英偉達 CEO 黃仁勳就近期備受關注的中國企業 DeepSeek 及 AI 行業發展發表了重要觀點。他特別指出,市場普遍對 AI 應用架構存在一個誤解,真正的 AI 應用應該包含三個同等重要的階段:預訓練、後訓練(推理能力學習)以及實際推理過程。預訓練階段使用多模態資料學習基礎知識;後訓練階段透過強化學習、人工反饋等方式培養模型的推理能力;而推理過程則需要模型進行復雜的思考和分析,包括並行試驗和分步推理。

他強調,預訓練雖然重要,但後訓練對智慧發展而言才是最關鍵的部分,因為這是將學到的知識應用於解決實際問題的過程。同時,推理過程本身也需要大量計算資源,因為 AI 在回答問題時需要進行多重推理和不斷修正。

談及 DeepSeek,黃仁勳認為其創新不會阻礙 AI 發展,反而會加速 AI 的應用擴充套件。「這對英偉達來說是一件好事,但從本質上說,所有的核心點都在於『應用層』的加速。」至於企業 AI 應用策略,黃仁勳提出了「多元並存」的觀點。他建議,企業可以同時採用公有云 AI 服務和自研 AI 系統。對於通用服務,可以優先使用公有云上的現成解決方案;而在企業特定專業領域,則可以基於開源模型和工具開發專有 AI 系統。(@APPSO)

更多 Voice Agent 學習筆記:

多模態 AI 怎麼玩?這裡有 18 個腦洞

AI 重塑宗教體驗,語音 Agent 能否成為突破點?

對話 TalktoApps 創始人:Voice AI 提高了我五倍的生產力,語音輸入是人機互動的未來

2024,語音 AI 元年;2025,Voice Agent 即將爆發丨年度報告發布

對話谷歌 Project Astra 研究主管:打造通用 AI 助理,主動影片互動和全雙工對話是未來重點

這家語音 AI 公司新融資 2700 萬美元,並預測了 2025 年語音技術趨勢

語音即入口:AI 語音互動如何重塑下一代智慧應用

Gemini 2.0 來了,這些 Voice Agent 開發者早已開始探索……

寫在最後:

我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。

對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。

素材來源官方媒體/網路新聞

相關文章