在 GPT-4o 釋放完整能力前,聽聽實時多模態 AI 創業者的一手經驗 | 編碼人聲

RTE开发者社区發表於2024-05-28

「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。

5 月中旬 GPT-4o 的釋出,讓人與 AI 的互動,從對話方塊的文字交流加速推進到了音影片多模態的實時互動。

本期節目,我們邀請到實時互動 AI 創業者史業民。他結合了自己的一手研發經驗,深度分析了 GPT-4o 在多模態、實時互動、情感語音的新能力和能力邊界,分享了 GPT-4o 正在催生的潛在場景和新機會。史業民還從開發者視角,提出了面向開發者的 GPT-4o 和麵向使用者的 ChatGPT 能力可能存在區別的提醒,以及在開發多模態 AI 產品時需要注意到的技術細節。

從對話方塊到音影片,多模態的實時互動 AI 已成趨勢。希望本期節目能對你有所啟發。

本期主播與嘉賓

  • 史業民:實時互動 AI 創業者,前智源研究院研究員。

  • 朱峰:「津津樂道播客網路」創始人,產品及技術專家。

相關資訊

  • 史業民團隊最新專案:Pandora,一個可透過語言互動控制的生成影片世界模型。https://world-model.ai

  • 一起探索人和 AI 的新連線方式!RTE 開發者社群將在 6 月 22 日、23 日,聯合 Founder Park 在北京舉辦線下的 AGI Playground 活動,邊玩邊探索 AGI 和 RTE 實時互動的新可能。加入社群微信群,還可以提前獲取活動訊息,抽免費活動門票。關注「RTE 開發者社群」微信公眾號,在後臺回覆「小助手」即可入群。

製作團隊

  • 後期 / 卷圈
  • 監製 / 姝琦
  • 產品統籌 / bobo
  • 聯合制作 / RTE 開發者社群

關於「編碼人聲」

「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。

錄製嘉賓覆蓋信通院 & 科委專家、國內外資深投資人、VR/AR & 虛擬人 & AIGC 等新興技術領域頭部創業者、一線網紅 & 硬核開發者、跨界畫家 & 作家 & 釀酒師等。

RTE 開發者社群是聚焦實時互動領域的中立開發者社群。不止於純粹的技術交流,我們相信開發者具備更加豐盈的個體價值。行業發展變革、開發者職涯發展、技術創業創新資源,我們將陪跑開發者,共享、共建、共成長。

社群於 2023 年底正式啟動了「主理人 + 工作組」的運營機制,並確認了社群的 3 位聯合主理人 ——

· 零一萬物 01.AI 開源負責人 @ 林旅強 Richard
· FreeSWITCH 中文社群創始人 @ 杜金房
· 小紅書音影片架構負責人 @ 陳靖

本節目由津津樂道播客網路與 RTE 開發者社群聯合制作播出。

相關文章