在 GPT-4o 釋放完整能力前,聽聽實時多模態 AI 創業者的一手經驗 | 編碼人聲
「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。
5 月中旬 GPT-4o 的釋出,讓人與 AI 的互動,從對話方塊的文字交流加速推進到了音影片多模態的實時互動。
本期節目,我們邀請到實時互動 AI 創業者史業民。他結合了自己的一手研發經驗,深度分析了 GPT-4o 在多模態、實時互動、情感語音的新能力和能力邊界,分享了 GPT-4o 正在催生的潛在場景和新機會。史業民還從開發者視角,提出了面向開發者的 GPT-4o 和麵向使用者的 ChatGPT 能力可能存在區別的提醒,以及在開發多模態 AI 產品時需要注意到的技術細節。
從對話方塊到音影片,多模態的實時互動 AI 已成趨勢。希望本期節目能對你有所啟發。
本期主播與嘉賓
史業民:實時互動 AI 創業者,前智源研究院研究員。
朱峰:「津津樂道播客網路」創始人,產品及技術專家。
相關資訊
史業民團隊最新專案:Pandora,一個可透過語言互動控制的生成影片世界模型。https://world-model.ai
一起探索人和 AI 的新連線方式!RTE 開發者社群將在 6 月 22 日、23 日,聯合 Founder Park 在北京舉辦線下的 AGI Playground 活動,邊玩邊探索 AGI 和 RTE 實時互動的新可能。加入社群微信群,還可以提前獲取活動訊息,抽免費活動門票。關注「RTE 開發者社群」微信公眾號,在後臺回覆「小助手」即可入群。
製作團隊
- 後期 / 卷圈
- 監製 / 姝琦
- 產品統籌 / bobo
- 聯合制作 / RTE 開發者社群
關於「編碼人聲」
「編碼人聲」是由「RTE 開發者社群」策劃的一檔播客節目,關注行業發展變革、開發者職涯發展、技術突破以及創業創新,由開發者來分享開發者眼中的工作與生活。
錄製嘉賓覆蓋信通院 & 科委專家、國內外資深投資人、VR/AR & 虛擬人 & AIGC 等新興技術領域頭部創業者、一線網紅 & 硬核開發者、跨界畫家 & 作家 & 釀酒師等。
RTE 開發者社群是聚焦實時互動領域的中立開發者社群。不止於純粹的技術交流,我們相信開發者具備更加豐盈的個體價值。行業發展變革、開發者職涯發展、技術創業創新資源,我們將陪跑開發者,共享、共建、共成長。
社群於 2023 年底正式啟動了「主理人 + 工作組」的運營機制,並確認了社群的 3 位聯合主理人 ——
· 零一萬物 01.AI 開源負責人 @ 林旅強 Richard
· FreeSWITCH 中文社群創始人 @ 杜金房
· 小紅書音影片架構負責人 @ 陳靖
本節目由津津樂道播客網路與 RTE 開發者社群聯合制作播出。
相關文章
- [讀者調查] 創宇前端期待聽到你的聲音前端
- 很好也很貴?OpenAI Realtime API 一手體驗和 Voice AI 的未來 |播客《編碼人聲》OpenAIAPI
- AI如何融入實體經濟?聽聽大咖怎麼講AI
- 【JS】在連續性監聽事件中,監聽當前狀態是否變化JS事件
- 科大訊飛:讓世界聽見AI的聲音AI
- “聽聲知著”|雲知聲AI開放平臺,打造有情感有溫度的定製音庫AI
- 關愛2700多萬聽障者,手語服務助力無聲交流
- 傾聽使用者心聲—京東商城智慧評價生態的構建
- iPhone曝嚴重漏洞,使用者接聽FaceTime前或被“監聽”!iPhone
- 空間計算、物理計算、實時模擬與創造擁有「自主行為」的小狗 | 播客《編碼人聲》
- 企業如何構建自己的 AI 編碼能力AI
- # [AI]多模態聚類能力助力AI完成自主意識測試AI聚類
- 曲婉婷的《我的歌聲裡》英文版超好聽喔,快來聽聽吧!
- 聽完這期音影片發展史,才更清楚元宇宙到底還行不行|編碼人聲元宇宙
- 聽潮汐,築燈塔,聚千帆:智慧港口全球創新實驗室啟航時
- 徹底提高英語聽力--經驗談
- Laravel 實時監聽列印 SQLLaravelSQL
- FDA釋出新規,AI助聽器“卷”起來AI
- 國內首個!商湯科技釋出“日日新5o”,實時多模態流式互動對標GPT-4oGPT
- IFPI:仍有38%的聽眾在聽盜版音樂
- 監聽者模式實戰應用模式
- 黑夜裡活躍的“耳朵經濟”:2億人一年花109億小時在聽書上
- 在duplicate時,出現監聽BLOCKED的情況,導致監聽自動關閉BloC
- oracle靜態監聽Oracle
- 聲揚科技聲紋識別技術,為工商銀行構建多模態反欺詐能力
- 時間監聽
- 實時監聽div,input內容改變並獲取值(包括指令碼動態新增)指令碼
- VueJS&&ReactJS如何?聽聽別人怎麼說。VueJSReact
- 使用Swoole的Websocket監聽使用者連線狀態Web
- 雲端計算儲存之什麼是Ceph?聽聽Ceph創始人怎麼說
- DFSS是什麼?聽說它是走向創新的必經之路
- 聽說你在為天天寫業務程式碼而煩惱?
- 噓,AI正在悄悄聽懂你的話AI
- js如何監聽頁面縮放?JS
- 有聲小說線上收聽網
- JavaScript實時監聽input中值變化JavaScript
- Spring AI多模態開發SpringAI
- 對談 MoonBit:AI 時代的程式語言應該是什麼樣子的?丨編碼人聲AI