直播預告:OpenAI 開始擁抱 RTC!為什麼 LLM+RTC 才是多模態 AI 的未來?丨 RTE Dev Talk

RTE开发者社区發表於2024-12-18

如果您正在開發具備語音對話、視覺理解等多模態能力的 AI Agent,請加入我們的直播討論!

OpenAI 今日釋出了 OpenAI Realtime API 的重大更新,其中包括價格下調、新增模型以及一項尤為重要的改進: WebRTC 支援 。結合此前 WebRTC 建立者加入 OpenAI 的訊息,這清晰地表明 OpenAI 正在積極擁抱 RTC 技術 ,以強化其多模態 AI 的傳輸能力。

RTC 讓開發者在 多平臺上構建實時語音 AI 產品變得更加簡便,無論是瀏覽器應用、移動客戶端、物聯網裝置,還是伺服器到伺服器連線。它還具備音訊編碼、流媒體傳輸、降噪和擁塞控制等關鍵功能,能夠在網路不穩定的情況下依然提供 流暢的使用者體驗。

如果您正在開發具備 語音對話、視覺理解等多模態能力的 AI Agent ,或者對探索下一代人機互動方式充滿熱情,歡迎你預約並收看 19 日(週四)晚八點 的 RTE Dev Talk!

RTE 開發者社群邀請了 多位 RTC 專家參與圓桌討論 。 從基本概念到技術對比,從實踐經驗和未來展望,助力你 成為更全面的多模態 AI Agent 開發者。

GenAI 已經從文字框互動迅速走向更自然、更擬人的多模態實時互動,期待和你一起成長和探索。

RTE Dev Talk 嘉賓和主持人

  • 毛玉傑,聲網生成式 AI 產品負責人,WebRTC 技術專家。曾參與過 Android、Chromium、WebRTC 等多個開源專案的開發。

  • Plutoless,實時語音 AI 智慧體開源框架 TEN Framework 的聯合發起人,擁有多年在實時互動領域的專業從業經驗。RTE
    開發者社群佈道師。

  • 白宦成(主持人),全流程工程師,AI 產品經理,RTE 開發者社群佈道師,《編碼人聲》主播。

時間:12 月 19 日(週四)20:00~21:15pm

地址:線上直播,歡迎提前預約,接收開播提醒

活動主辦:RTE 開發者社群

社群夥伴支援:語音之家、TEN Framework

更多 Voice Agent 學習筆記:

Gemini 2.0 來了,這些 Voice Agent 開發者早已開始探索……

幫助使用者與 AI 實時練習口語,Speak 為何能估值 10 億美元?丨 Voice Agent 學習筆記

市場規模超 60 億美元,語音如何改變對話式 AI?

2024 語音模型前沿研究整理,Voice Agent 開發者必讀

從開發者工具轉型 AI 呼叫中心,這家 Voice Agent 公司已服務 100+ 客戶

WebRTC 建立者剛加入了 OpenAI,他是如何思考語音 AI 的未來?

人類級別語音 AI 路線圖丨 Voice Agent 學習筆記

語音 AI 革命:未來,消費者更可能傾向於與 AI 溝通,而非人工客服

語音 AI 迎來爆發期,也仍然隱藏著被低估的機會丨 RTE2024 音訊技術和 Voice AI 專場

下一代 AI 陪伴 | 平等關係、長久記憶與情境共享 | 播客《編碼人聲》

Voice-first,閉關做一款語音產品的思考|社群來稿

相關文章