在 GPT-4o 釋放完整能力前,聽聽實時多模態 AI 創業者的一手經驗 | 編碼人聲
「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。
5 月中旬 GPT-4o 的釋出,讓人與 AI 的互動,從對話方塊的文字交流加速推進到了音影片多模態的實時互動。
本期節目,我們邀請到實時互動 AI 創業者史業民。他結合了自己的一手研發經驗,深度分析了 GPT-4o 在多模態、實時互動、情感語音的新能力和能力邊界,分享了 GPT-4o 正在催生的潛在場景和新機會。史業民還從開發者視角,提出了面向開發者的 GPT-4o 和麵向使用者的 ChatGPT 能力可能存在區別的提醒,以及在開發多模態 AI 產品時需要注意到的技術細節。
從對話方塊到音影片,多模態的實時互動 AI 已成趨勢。希望本期節目能對你有所啟發。
本期主播與嘉賓
史業民:實時互動 AI 創業者,前智源研究院研究員。
朱峰:「津津樂道播客網路」創始人,產品及技術專家。
相關資訊
史業民團隊最新專案:Pandora,一個可透過語言互動控制的生成影片世界模型。https://world-model.ai
一起探索人和 AI 的新連線方式!RTE 開發者社群將在 6 月 22 日、23 日,聯合 Founder Park 在北京舉辦線下的 AGI Playground 活動,邊玩邊探索 AGI 和 RTE 實時互動的新可能。加入社群微信群,還可以提前獲取活動訊息,抽免費活動門票。關注「RTE 開發者社群」微信公眾號,在後臺回覆「小助手」即可入群。
製作團隊
- 後期 / 卷圈
- 監製 / 姝琦
- 產品統籌 / bobo
- 聯合制作 / RTE 開發者社群
關於「編碼人聲」
「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。
錄製嘉賓覆蓋信通院 & 科委專家、國內外資深投資人、VR/AR & 虛擬人 & AIGC 等新興技術領域頭部創業者、一線網紅 & 硬核開發者、跨界畫家 & 作家 & 釀酒師等。
RTE 開發者社群是聚焦實時互動領域的中立開發者社群。不止於純粹的技術交流,我們相信開發者具備更加豐盈的個體價值。行業發展變革、開發者職涯發展、技術創業創新資源,我們將陪跑開發者,共享、共建、共成長。
社群於 2023 年底正式啟動了「主理人 + 工作組」的運營機制,並確認了社群的 3 位聯合主理人 ——
· 零一萬物 01.AI 開源負責人 @ 林旅強 Richard
· FreeSWITCH 中文社群創始人 @ 杜金房
· 小紅書音影片架構負責人 @ 陳靖
本節目由津津樂道播客網路與 RTE 開發者社群聯合制作播出。
相關文章
- [讀者調查] 創宇前端期待聽到你的聲音前端
- iPhone這個鈴聲,多少人只聽過開頭卻沒聽過完整版?iPhone
- 產品經理該聽聽你的團隊的呼聲
- AI如何融入實體經濟?聽聽大咖怎麼講AI
- 很好也很貴?OpenAI Realtime API 一手體驗和 Voice AI 的未來 |播客《編碼人聲》OpenAIAPI
- 同時配置動態監聽與靜態監聽
- 【JS】在連續性監聽事件中,監聽當前狀態是否變化JS事件
- 多聽FM釋出車載網路電臺“車聽寶”,打造車內收聽新體驗
- 預設及非預設埠的動態監聽/靜態監聽實驗彙總
- 【LISTENER】通過密碼驗證使非oracle使用者具有管理監聽的能力密碼Oracle
- 網際網路“+”什麼?聽聽這八名創業者怎麼說創業
- 科大訊飛:讓世界聽見AI的聲音AI
- 聽聽創業政策那些事兒|UCCVR分享會創業VR
- 聽聽各種排序演算法的聲音排序演算法
- “聽聲知著”|雲知聲AI開放平臺,打造有情感有溫度的定製音庫AI
- 【轉】【完善】【LISTENER】通過密碼驗證使非oracle使用者具有管理監聽的能力密碼Oracle
- # [AI]多模態聚類能力助力AI完成自主意識測試AI聚類
- 【原創】Oracle的動態監聽註冊Oracle
- 動態監聽與靜態監聽
- 動態監聽和靜態監聽
- 傾聽使用者心聲—京東商城智慧評價生態的構建
- ORACLE 動態註冊,靜態註冊,多個監聽,一個監聽多個埠配置Oracle
- RethinkDB 創始人總結的 57 條創業經驗創業
- ORACLE動態監聽與靜態監聽Oracle
- oracle靜態監聽和動態監聽Oracle
- 【oracle】動態監聽與靜態監聽Oracle
- 請聽Linux孵化者們的戰鬥心聲(轉)Linux
- 寫程式碼時你可以聽聽這些音樂
- 無聲處聽驚雷!如何用微文案改善網站的使用者體驗?網站
- iPhone曝嚴重漏洞,使用者接聽FaceTime前或被“監聽”!iPhone
- 聽潮汐,築燈塔,聚千帆:智慧港口全球創新實驗室啟航時
- 聽完這期音影片發展史,才更清楚元宇宙到底還行不行|編碼人聲元宇宙
- 聲揚科技聲紋識別技術,為工商銀行構建多模態反欺詐能力
- 國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4oGPT
- 徹底提高英語聽力--經驗談
- wriesharek同時監聽多個埠
- FM收聽新方式?多聽FM將釋出全新車載智慧硬體
- Laravel 實時監聽列印 SQLLaravelSQL