2 行程式碼,15 分鐘部署對話式 AI Agent!丨社群來稿

RTE开发者社区發表於2025-02-19

// 本文來自聲網的投稿。

基於開源框架 TEN Framework 構建,聲網近日推出了最新的對話式 AI 引擎。這是一個「開箱即用」的對話式 AI 部署解決方案。2 行程式碼,15 分鐘,即使像 DeepSeek 這樣的文字大模型也能快速轉變為對話式多模態大模型,具備能說會道的能力。

透過官方 demo 網站,你可以體驗到智慧助手、情感陪伴、口語陪練、智慧客服等多種對話式 AI 的使用場景。

快來體驗和 AI 實時對話

👇https://conversational-ai.shengwang.cn

Beta 測試階段限時免費,更多產品介紹和文件:

https://www.shengwang.cn/ConversationalAI/

近期,DeepSeek 旋風席捲全球,其獨有的深度思考 + 聯網模式讓使用者紛紛驚歎好用,如果你想脫離與 AI 的文字互動,與 DeepSeek 進行更具真實感的語音對話,聲網的對話式 AI 引擎讓你 15 分鐘內就能做到。

今天,聲網對話式 AI 引擎 Beta 版也正式上線,支援開發者在 Console 後臺自行開通服務接入 API,並在 Playground 中實際調參、測試並生成程式碼,僅需 2 行程式碼,15 分鐘即可部署基於大模型的對話式 AI Agent。

聲網對話式 AI 引擎官網也已同步上線,開發者在瞭解產品功能的同時,也可透過官網申請體驗最新的 Demo 應用。

5 大能力讓你的大模型能說會道

AI 語音秒回: AI 秒回你的提問,語音對話延遲低至 650ms

對話人聲鎖定: 遮蔽 95% 環境人聲、噪聲干擾,精準識別對話人聲

智慧打斷: 模擬真人對話節奏,隨時打斷與 AI 的對話,響應低至 340ms

全模型適配: 實現 DeepSeek、ChatGPT 等全模型適配,更有音影片 SDK 支援 30000+ 終端機型適配,解決多裝置相容性的後顧之憂

不懼弱網: 地鐵、地下車庫等弱網環境下,人與 AI 也能流暢對話

聲網對話式 AI 引擎將為開發者帶來極致的對話體驗、極簡的開發部署, 即使像 DeepSeek 這樣的文字大模型也能快速轉變為對話式多模態大模型,具備能說會道的能力 。同時,對話式 AI 引擎同樣支援基於阿里雲、騰訊雲的穩定滿血版 DeepSeek ,不用擔心出現 “伺服器繁忙,請稍後再試”。

如何快速部署對話式 AI 引擎

開發者想要快速呼叫聲網對話式 AI 引擎 RESTful API 實現與 AI 語音互動,根據以下流程就可透過 2 行程式碼,15 分鐘快速實現從開啟 Console 後臺到說『Hello Agent』,大幅降低開發門檻。

前提條件:

1、已在聲網 Console 控制檯開通服務,並獲得 App ID、臨時 Token、客戶 ID 和客戶金鑰等資訊。

2、已聯絡聲網技術支援為你的專案開通聲網對話式 AI 引擎。

3、你的 App 已實現基本的實時音影片功能。

4、已獲取大模型提供商的 API key 和回撥 URL。

5、已獲取文字轉語音 (TTS) 提供商的 API key。

滿足以上前提條件,就可實現與 Agent 的語音互動。具體流程如下圖所示:

總體來說部署流程分為三個核心步驟: 第一步:加入 RTC 頻道 ,在你的 App 中呼叫『 joinChannel 』加入一個 RTC 頻道。

第二步:建立對話式智慧體 :呼叫『 建立對話式智慧體』建立一個智慧體例項,並傳入上一步中使用的頻道名和 Token 讓智慧體加入同一個 RTC 頻道。完成該步驟後,聲網會推薦你前往 “控制檯 - 對話式 AI 引擎 - Playground” 快速體驗與 AI 對話,正確配置各項引數並完成體驗後,點選右上角的 View code 複製自動生成的服務端 API 呼叫示例程式碼。

第三步:停止對話式智慧體 :結束對話後,呼叫『停止對話式智慧體』,讓智慧體離開 RTC 頻道。

更多具體的詳細部署流程可點選檢視官網的文件中心

此外,聲網對話式 AI 引擎 在 Beta 測試階段限時免費,歡迎各行各業的開發者參與部署並與我們交流。同時,也可透過聲網官網或下方的二維碼,申請體驗聲網對話式 AI 引擎最新的 Demo 應用。

更多 Voice Agent 學習筆記:

多模態 AI 怎麼玩?這裡有 18 個腦洞

AI 重塑宗教體驗,語音 Agent 能否成為突破點?

對話 TalktoApps 創始人:Voice AI 提高了我五倍的生產力,語音輸入是人機互動的未來

2024,語音 AI 元年;2025,Voice Agent 即將爆發丨年度報告發布

對話谷歌 Project Astra 研究主管:打造通用 AI 助理,主動影片互動和全雙工對話是未來重點

這家語音 AI 公司新融資 2700 萬美元,並預測了 2025 年語音技術趨勢

語音即入口:AI 語音互動如何重塑下一代智慧應用

Gemini 2.0 來了,這些 Voice Agent 開發者早已開始探索……

相關文章