Product Hunt 金喵獎 Voice AI 專案一覽;AI 招聘平臺 Mercor 再融資,估值 20 億美元 丨日報
開發者朋友們大家好:
這裡是「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社群編輯團隊會整理分享 RTE(Real-Time Engagement)領域內「有話題的 技術 」、「有亮點的 產品 」、「有思考的 文章 」、「有態度的 觀點 」、「有看點的 活動 」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@qqq、@ 鮑勃
01 創業眾籌|社群專案推薦
1、從網癮少年到融資百萬:我被一隻球藻改變的人生!
十年前的你在做些什麼呢
十年前有一位少年
把做作業的檯燈讓給了球藻
因為這顆綠球球
從此走上了創業的道路
“這一顆綠球球,
至少 三次改變了我的人生軌跡。
總能在我覺得山窮水盡的時候,
默默發光,
帶給我希望。”
十年後這顆綠球球帶來的 AI 陪伴軟體
——「來萌 APP」
因為資金問題無法迭代
目前正在發起眾籌...
這個曾經的少年叫萬一,他說:「2024 年的夏天結束時,我們迴歸「陪伴與治癒」的核心。我給這個為 EMO 青年 做的 APP,取名 來萌 LIMO。我體驗過市面上的所有 AI 陪伴軟體,都很 生硬 。他們像一個個沒有新故事的 NPC,死板地討好你。我發現,不論 AI 角色,還是遊戲和動漫的 IP,一個角色是否鮮活,都來自 創作者是否用心 。我 不想做 一隻順從你,永遠正確,沒有變化的 NPC 寵物。球藻君應該是一個有自己個性和生活的 AI 夥伴。你依賴他,他也依賴你。 我突然有信心了,球藻君或許能成為 AI 界一個不一樣的存在。我能做出那些 技術宅們 想不出的東西!」
(@ 球藻君 MOLI)
👉眾籌活動完整介紹
02 有話題的技術
1、清華團隊構建大型社會模擬器 AgentSociety ,可精確模擬社會輿論傳播、公眾政策響應等社會現象
清華團隊開源了一個"人工社會"模擬系統:AgentSociety,它把 LLM 與傳統社會行為理論結合,能真實的模擬人類行為及社會互動可以用來研究人類社會行為、模擬城市環境中的社會互動,測試各種社會場景和政策效果等。它整合了 LLM 的規劃、記憶和推理能力,可以生成真實的行為模擬,支援馬斯洛需求層次等理論模型,支援多種環境型別,基於資料集的、文字的或規則的,可以模擬不同程度的真實性和互動性
框架架構
模型層,負責智慧體配置和任務管理
智慧體層,管理記憶、決策和行動
訊息層,處理智慧體之間的通訊
環境層,管理智慧體與環境的互動
LLM 層,整合大語言模型,OpenAI、Qwen 等
工具層,提供字串處理、結果分析、資料儲存和檢索等各種實用工具
為了降低智慧體間通訊的系統開銷,團隊引入了智慧體分組(Agent Group)機制,使多個智慧體可以在單個程序中執行,從而減少程序間通訊開銷,提高計算效率。此外,為了實現大規模社會智慧體的高併發、可靠訊息傳輸,團隊引入了 MQTT 通訊協議,該協議廣泛應用於物聯網場景,具備高吞吐量和低延遲的特點,非常適用於大規模社會模擬中智慧體間的資訊交換。(@AIGCLINK@X、AIGC 開放社群)
2、月之暗面 Kimi 開源 MoE 模型
2 月 23 日,月之暗面釋出最新論文《Muon is Scalable for LLM Training》,並首次開源了 MoE(混合專家)模型 Moonlight-16B-A3B,論文顯示,月之暗面透過深度改造 Muon 最佳化器,並將其運用於實際訓練,證明了 Muon 在更大規模訓練中的有效性,是 AdamW 訓練效率的 2 倍,且模型效能相當。據悉,本次論文所使用的模型為 Moonlight-16B-A3B,總引數量為 15.29B,啟用引數為 2.24B,其使用 Muon 最佳化器,在 5.7T Tokens 的訓練資料下獲得上述成績。目前,論文及 Moonlight-16B-A3B 相關內容已上架 Github 和 HuggingFace。(@APPSO)
03 有亮點的產品
1、中科聞歌釋出智川 X-Agent 平臺、優雅音影片大模型更新,領先技術加速 AI 普惠落地
2 月 22 日,中科聞歌 2025 AI 新產品線上釋出會成功舉辦,升級釋出「智川」企業智慧體平臺 1.0 與「優雅」音影片大模型平臺 1.5,助力政企極速落地 AI 應用與創意靈感,讓 AI 技術精細化滿足真實業務場景,加速 AI 普惠落地。
智川 X-Agent:一站式企業智慧體開發平臺,個性化 AI 應用極速落地
核心功能
零程式碼 AI 應用搭建,10 秒定義專屬智慧體
10+ 先進大模型隨心配,能力邊界盡在掌控
視覺化工作流編排,解鎖 AI 應用無限可能
知識庫自主管理,私域知識高效利用
支援建立自定義外掛,智慧體技能無限擴充套件
視覺化運營,知識反哺自我進化
優雅平臺:多模態內容智慧生成平臺,讓你的靈感「優雅」實現
亮點功能
長影片一鍵拆分智慧體,短影片批次速成
一鍵成片智慧體,語義級別畫面匹配
多語種影片翻譯智慧體,國際傳播更高效
記者採寫智慧體,分鐘級實現原創首發
智慧體廣場,靈活快速構建 AI 應用
豐富 AI 工具集,滿足多樣創意需求(@ 量子位)
2、00 後創辦的 AI 招聘,融資 1 億美元,估值 20 億美元
Mercor,由三位 21 歲的 Thiel Fellows 創辦的人工智慧招聘初創公司,已在 B 輪融資中籌集了 1 億美元,公司向 TechCrunch 確認了這一訊息。
這一輪融資使得執行長 Brendan Foody、技術長 Adarsh Hiremath 和營運長 Surya Midha 成為一些最年輕的十億美元初創公司的創始人。這家成立兩年的平臺,擁有彼得·蒂爾、傑克·多爾西和亞當·丹吉洛等投資者,表示最新的融資將幫助「加速其將數十億人與他們的使命匹配的能力,充分發揮人類才能的潛力。」
成立於 2023 年,Mercor 利用人工智慧簡化招聘。 其平臺自動化簡歷篩選、候選人匹配,提供人工智慧驅動的面試和薪資管理。僱主上傳職位描述,Mercor 的系統推薦最佳候選人。
Mercor 聲稱其自動化系統不僅簡化了招聘流程,還消除了過程中的偏見。該宣告聲稱,人工智慧系統的偏見程度低於人類,這一說法並不總是成立。儘管如此,像 OpenAI 這樣的科技公司已經在使用 Mercor 的自動化工具,該公司聲稱這些工具能夠找到比其他人類更優秀的人選。
求職者完成一個 20 分鐘的 AI 面試,評估他們的技能並建立個人檔案。該平臺隨後將他們與相關的全職、兼職或小時工職位匹配。
Mercor 最初專注於招聘軟體工程師和技術專業人員,涉及運營、內容創作、產品開發和設計 。Foody 表示,軟體工程師仍然是 Mercor 目前最受歡迎的人才。但人工智慧實驗室越來越多地尋求其他專業人士——顧問、博士、銀行家、醫生和律師。(@Z Potentials)
3、全球產品界的奧斯卡,Product Hunt 2024 年金喵獎揭曉,眾多華人 AI 產品上榜
Product Hunt 的 Golden Kitty Awards(金喵獎)是每年一度的全球新產品評選盛典,旨在表彰當年最具創新性、影響力和使用者歡迎度的產品。該獎項透過社群投票和專家評審綜合選出覆蓋科技、工具、硬體等領域的年度最佳產品(如 ChatGPT、Figma 等曾獲獎),其名人堂記錄歷屆獲獎作品,成為行業趨勢風向標和創業者的榮譽殿堂。以下為 AI 硬體和音訊類目中的一些產品:
(1)Friend :一款旨在陪伴使用者、對抗孤獨的 AI 穿戴裝置。
(圖片來源:Product Hunt)
https://friend.com/wearable/index.html
Friend 定位為一款旨在提供陪伴的 AI 穿戴裝置,其核心價值主張是透過技術手段緩解孤獨感。目標使用者是需要情感支援、尋求陪伴的人群。該產品解決了現代社會日益嚴重的孤獨問題,透過 AI 技術提供一種新型的情感連線方式。隨著社會隔離現象的加劇,情感陪伴型 AI 產品具有廣闊的市場需求。
Friend 的核心功能亮點在於其陪伴功能,但具體細節未充分展示。其差異化優勢在於明確針對情感需求設計,有別於傳統智慧穿戴裝置。使用者體驗方面,產品設計理念著重於提供友好的陪伴,但具體實現和體驗效果需進一步瞭解。Friend 旨在透過 AI 技術提供情感支援,為使用者提供一種新型的陪伴方式,具有一定的社會價值和市場潛力。(@Z Potentials)
(2)ElevenLabs :一款先進的文字轉語音和語音克隆 AI 平臺
(圖片來源:Product Hunt)
https://elevenlabs.io/
ElevenLabs 定位為一款先進的 AI 語音平臺,其核心價值主張是提供逼真且情感豐富的文字轉語音服務,並支援語音克隆技術。目標使用者是內容創作者、遊戲開發者、電影製作人以及任何需要高質量語音解決方案的個人和企業。該產品解決了傳統語音合成技術不夠自然、缺乏情感的痛點,為使用者提供了更具表現力和個性化的語音體驗。隨著數字內容創作的蓬勃發展,ElevenLabs 具有廣闊的市場機會。
ElevenLabs 的核心功能亮點包括逼真的文字轉語音、語音克隆和語音定製。其差異化優勢在於其高質量的語音合成效果,能夠模仿人類語音的細微差別和情感,以及其強大的語音克隆技術。(@Z Potentials)
(3)Voicenotes :一款智慧 AI 筆記應用
(圖片來源:Product Hunt)
https://voicenotes.com/
Voicenotes 定位為一款智慧筆記應用,其核心價值主張是透過 AI 技術簡化筆記流程,並提供強大的資訊回顧和整理能力。目標使用者是需要高效記錄、整理和回顧資訊的知識工作者、學生、記者等。該產品解決了傳統筆記方式效率低、資訊難以回顧的痛點,提供了一種更便捷、智慧的筆記解決方案。在資訊爆炸的時代,高效的資訊管理工具具有巨大的市場需求,Voicenotes 具有廣闊的市場機會。
Voicenotes 的核心功能亮點包括語音轉錄、AI 問答和內容重組。其差異化優勢在於其智慧化的 AI 分析能力,可以對筆記內容進行總結、提取要點,甚至生成部落格文章草稿。使用者體驗方面,Voicenotes 操作簡單,介面直觀,並且支援多平臺使用,使用者可以隨時隨地記錄和回顧資訊。(@Z Potentials)
(4)Vapi:一款為開發者提供語音 AI 基礎設施的平臺。
(圖片來源:Product Hunt)
https://vapi.ai/
Vapi 定位為面向開發者的語音 AI 基礎設施平臺,其核心價值主張是簡化語音機器人的開發流程,讓開發者能夠在幾分鐘內構建、測試和部署語音應用。目標使用者是希望在自己的產品中整合語音 AI 功能的開發者和企業。該產品解決了傳統語音機器人開發週期長、成本高的痛點,為使用者提供了一種更快速、便捷的解決方案。隨著語音 AI 技術的普及,Vapi 具有廣闊的市場機會。
Vapi 的核心功能亮點包括簡化的開發流程、靈活的定製選項和強大的客戶支援。其差異化優勢在於其易用性,以及對各種 LLM/STT/TTS 模型、Web SDK 的支援。(@Z Potentials)
(5)GPT-4o :OpenAI 推出的多模態 AI 模型
(圖片來源:Product Hunt)
https://openai.com/index/hello-gpt-4o/
GPT-4o 定位為 OpenAI 的最新一代多模態 AI 模型,其核心價值主張是實現更自然、更流暢的人機互動,支援文字、語音和視覺輸入。目標使用者是開發者、企業和普通使用者,他們希望利用先進的 AI 技術來構建各種應用,例如聊天機器人、虛擬助手和內容創作工具。該產品旨在解決傳統 AI 模型在處理多模態輸入方面的侷限性,並提供更接近人類的互動體驗。隨著 AI 技術的不斷發展,對多模態 AI 模型的需求日益增長,GPT-4o 具有廣闊的市場機會。
GPT-4o 的核心功能亮點包括多模態輸入支援、實時語音互動和增強的推理能力。其差異化優勢在於其對多種模態的無縫整合,以及其在語音互動方面的顯著改進。(@Z Potentials)
(6)Earth.fm :一款提供純淨自然聲景的非營利應用,類似 Spotify,但專注於自然聲音
(圖片來源:Product Hunt)
https://earth.fm/app/
Earth.fm 定位為一款非營利的自然聲景應用,其核心價值主張是提供高質量、純淨的自然聲音,幫助使用者放鬆身心、連線自然。目標使用者是喜愛大自然、需要放鬆減壓、以及對冥想和心理健康有需求的人群。該產品旨在解決城市生活噪音汙染、人們難以接觸自然的問題,提供一種隨時隨地沉浸於自然的方式。隨著人們對心理健康的日益重視,以及對自然環境的嚮往,Earth.fm 具有廣闊的市場機會。
Earth.fm 的核心功能亮點包括 900+ 自然聲景、聲音地圖和離線播放。其差異化優勢在於其非營利性質、高質量的聲音資源,以及對環境保護的支援。使用者體驗方面,Earth.fm 應用介面簡潔,易於使用,並且提供多種分類和播放選項,使用者可以根據自己的喜好選擇不同的自然聲景。(@Z Potentials)
(7)Airchat :一款社交語音對講應用
(圖片來源:Product Hunt)
https://air.chat/
Airchat 定位為一款社交語音對講應用,其核心價值主張是提供便捷的語音交流體驗,讓使用者隨時隨地與他人進行語音對話。目標使用者是對語音交流感興趣,並希望尋找新的社交方式的人群。該產品旨在解決傳統社交媒體文字交流效率低、缺乏情感的痛點,提供一種更直接、更生動的交流方式。
Airchat 的核心功能是語音對講,使用者可以隨時發起或加入語音訊道。其差異化優勢在於其語音交流的特性,以及 '社交語音對講' 的概念。(@Z Potentials)
04 有態度的觀點
1、英偉達 CEO 黃仁勳首度回應 DeepSeek 衝擊:「對英偉達來說是一件好事」
在近日舉辦的 Beyond Artificial 大會上,英偉達 CEO 黃仁勳就近期備受關注的中國企業 DeepSeek 及 AI 行業發展發表了重要觀點。他特別指出,市場普遍對 AI 應用架構存在一個誤解,真正的 AI 應用應該包含三個同等重要的階段:預訓練、後訓練(推理能力學習)以及實際推理過程。預訓練階段使用多模態資料學習基礎知識;後訓練階段透過強化學習、人工反饋等方式培養模型的推理能力;而推理過程則需要模型進行復雜的思考和分析,包括並行試驗和分步推理。
他強調,預訓練雖然重要,但後訓練對智慧發展而言才是最關鍵的部分,因為這是將學到的知識應用於解決實際問題的過程。同時,推理過程本身也需要大量計算資源,因為 AI 在回答問題時需要進行多重推理和不斷修正。
談及 DeepSeek,黃仁勳認為其創新不會阻礙 AI 發展,反而會加速 AI 的應用擴充套件。「這對英偉達來說是一件好事,但從本質上說,所有的核心點都在於『應用層』的加速。」至於企業 AI 應用策略,黃仁勳提出了「多元並存」的觀點。他建議,企業可以同時採用公有云 AI 服務和自研 AI 系統。對於通用服務,可以優先使用公有云上的現成解決方案;而在企業特定專業領域,則可以基於開源模型和工具開發專有 AI 系統。(@APPSO)
更多 Voice Agent 學習筆記:
多模態 AI 怎麼玩?這裡有 18 個腦洞
AI 重塑宗教體驗,語音 Agent 能否成為突破點?
對話 TalktoApps 創始人:Voice AI 提高了我五倍的生產力,語音輸入是人機互動的未來
2024,語音 AI 元年;2025,Voice Agent 即將爆發丨年度報告發布
對話谷歌 Project Astra 研究主管:打造通用 AI 助理,主動影片互動和全雙工對話是未來重點
這家語音 AI 公司新融資 2700 萬美元,並預測了 2025 年語音技術趨勢
語音即入口:AI 語音互動如何重塑下一代智慧應用
Gemini 2.0 來了,這些 Voice Agent 開發者早已開始探索……
寫在最後:
我們歡迎更多的小夥伴參與 「RTE 開發者日報」 內容的共創,感興趣的朋友請透過開發者社群或公眾號留言聯絡,記得報暗號「共創」。
對於任何反饋(包括但不限於內容上、形式上)我們不勝感激、並有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、專案、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網路新聞
相關文章
- AI獨角獸第四正規化再融2.3億美元,估值20億美元,思科聯想入股AI
- AI 口語學習應用 Speak 新一輪融資估值 10 億美元;YouTube 推出 AI 多語言配音丨 RTE 開發者日報AI開發者日報
- AI一分鐘 | 傳螞蟻金服融資100億美元,估值1500億美元;美國擬建百億億次級超算AI
- AI一分鐘 | 傳螞蟻金服融資100億美元,估值1500億美元;美國擬建百億億次級超算...AI
- AI晶片獨角獸寒武紀新融資完成:估值逾20億美元,國家隊基金入場AI晶片
- Discord融資5億美元,估值飆漲至150億
- UiPath獲E輪2.25億美元融資:估值102億美元成全球估值最高RPA企業UI
- 幫助使用者與 AI 實時練習口語,Speak 為何能估值 10 億美元?丨 Voice Agent 學習筆記AI筆記
- AI一分鐘 | Facebook或將面臨2萬億美元罰款;大疆尋求新一輪融資,估值150億美元AI
- Docker 獲 7500 萬美元融資,估值達 13 億美元|航海日誌 Vol.24Docker
- 曠視科技完成7.5億美元D輪融資,估值達40億美元
- 巨人網路產業投資AI影像生成平臺LiblibAI,後者再獲數億元融資產業AI
- “AI明星”地平線B輪融資6億美元!AI
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨 RTE 開發者日報AI3D開發者日報
- Rokid Glasses AR 眼鏡釋出,搭載通義 AI;3D 社交平臺 SEELE 完成千萬美元融資丨RTE 開發者日報AI3D開發者日報
- AI晶片年度最大融資,地平線將融資10億美元!AI晶片學者地圖出爐AI晶片地圖
- Epic將展開新一輪融資 或使公司估值達170億美元
- PHP AI 核心程式碼,估值十個億!PHPAI
- 馬斯克的 xAI 融資 60 億美元;英偉達收購兩家 AI 創企丨 RTE 開發者日報 Vol.193馬斯克AI開發者日報
- 優必選宣佈完成8.2億美元C輪融資, 估值50億美元后,我們專訪了CEO周劍
- 下一個「Roblox」?社交遊戲平臺「Rec Room」融資1億美元遊戲OOM
- 美國遊戲平臺Roblox擬直接上市 以近300億美元估值完成新融資遊戲
- 估值80億美元的少兒遊戲平臺Roblox要上市了遊戲
- AI專案依賴安全分析評估AI
- AI 語音獨角獸 ElevenLabs C 輪融資估值超 30 億美元;港科大 Llasa TTS:15 秒聲音克隆支援中英雙語AITTS
- 一文讀懂螞蟻集團:C輪融資估值已達1500億美元,如今價值幾何?
- Runway 新增影片擴充套件畫面功能;Anthropic 再獲亞馬遜投資 40 億美元,聚焦 AI 晶片研發丨 RTE 開發者日報套件亞馬遜AI晶片開發者日報
- 谷歌釋出 Android XR 整合 Gemini 語音對話;Voice Agent 平臺 Vapi 獲 2000 萬美元融資谷歌AndroidAPI
- 人類級別語音 AI 路線圖丨 Voice AI 學習筆記AI筆記
- 語音生成公司 ElevenLabs 估值達 30 億美元;OpenAI Realtime API 很好也很貴丨 RTE 開發者日報OpenAIAPI開發者日報
- 馬斯克xAI瘋狂融資,兩週內將攬60億美元,估值飆至180億馬斯克AI
- OpenAI 曝新專案「草莓」,提升 AI 推理能力;智譜 AI 開源影片理解模型丨 RTE 開發者日報OpenAI模型開發者日報
- 20大AI專案斬獲AI生產力創新獎!四大領域全面開花AI
- 融資20億,坐擁全球首款物聯網AI晶片,這家AI獨角獸擬登科創板AI晶片
- 暗物智慧完成數千萬美元Pre-A輪融資,強認知AI平臺的開拓者AI
- 活了256年的大英百科,傍上AI後把估值幹到10億美元AI
- 商業融資專案(智慧商城+配送服務平臺)
- 2024,語音 AI 元年;2025,Voice Agent 即將爆發丨年度報告發布AI