直播預告|Sora 會怎樣驅動影片編解碼領域的突破與革新

RTE开发者社区發表於2024-03-20

在數字化時代,影片內容的傳播與消費已成為日常生活的一部分。影片編解碼技術是數字媒體領域的一項核心技術,它影響著影片質量,傳輸速度以及觀看體驗。與此同時,影片產業正在經歷一場由技術驅動的變革,Sora、AIGC 等相關技術的興起正是這場變革的關鍵推手。

本期 RTE Dev Talk,我們邀請到了 IEEE 1857.11 標準工作小組組長 劉東教授 線上分享 “端到端影像編碼技術與標準”,以及雙深科技 CTO 武祥吉老師,聲網合夥人、VP 孫雨潤等大佬深入分析 Sora 技術在壓縮演算法、實時傳輸和跨平臺相容性方面的創新,以及這些技術是如何改變現有的影片編解碼技術,以及影響未來的影片產業發展。

立即報名,和我們一同線上探討 Sora 技術及其在影片編解碼領域所帶來變革的深刻理解,以及 Sora 及相關技術發展將如何塑造一個更加智慧、高效的影片產業新生態。

時間:3 月 27 日(週三)20:00 - 21:00
形式:線上直播

活動安排 Agenda

20:00 - 20:20 主題分享:端到端影像編碼技術與標準

20:20 - 21:00 圓桌討論:Sora 在影片編解碼領域的突破與革新

嘉賓簡介

中國科學技術大學特任教授,IEEE 1857.11 標準工作小組組長

劉東

端到端影像編碼技術與標準

個人簡介:

劉東博士,中國科學技術大學資訊科學技術學院電子工程與資訊科學系特任教授、博士生導師、系副主任,獲得國家自然科學基金優青專案資助。2004 年、2009 年在中國科大分別獲得學士和博士學位。2009 年至 2012 年任職於諾基亞北京研究院。2012 年至今歷任中國科大軌道制副教授、副教授、特任教授。研究領域為影像影片處理、編碼、分析和資料探勘。在國際期刊和會議上發表論文 200 餘篇,谷歌學術總引用超過 16000 次,h 指數 50。獲授權發明專利 30 餘項,多項技術提案被國際國內標準組織採納。現為 IEEE、中國計算機學會、中國圖象圖形學學會高階會員,IEEE 電路與系統學會多媒體系統及應用技術委員會委員,中國圖象圖形學學會多媒體專業委員會常務委員。任 IEEE 1857.11 標準工作小組組長,IEEE TIP 期刊副編輯等。

分享內容簡介:

各種各樣的應用場景中每天都在產生大量的影像資料,AIGC 的興起更是加速了影像資料的爆發式增長。海量資料給儲存和傳輸帶來巨大壓力,迫切需要影像編碼技術對資料進行更高效的壓縮。

近年來,人工智慧和深度學習被運用到影像編碼中,產生了端到端學習的影像編碼技術,其核心思想是利用神經網路構建編碼器和解碼器中的計算單元,並利用率失真函式對整個網路進行整體最佳化。端到端影像編碼技術從 2015 年起步,現在已經表現出相比傳統技術的顯著優勢,但也提出了計算複雜度過高等挑戰。國內外研究人員不斷尋求更新更好的端到端影像編碼技術,併合作制定了新的影像編碼標準,例如 IEEE 1857.11 和 JPEG AI 等。

此次分享將簡要介紹端到端影像編碼技術的核心原理、當前水平以及相關標準的最新進展,並討論下一步發展趨勢等。

上海雙深資訊科技 CTO

武祥吉

2017 屆浙江大學碩士畢業,國內最早從事 AI 編解碼研究的一批人,在 CVPR2019/2020/2021 影像影片編碼賽道中,獲得多次世界第一。與團隊一起參與制訂 IEEE 1857.11 AI 端到端影像編碼標準, 貢獻了一項適合 NPU 平行計算的熵模型加速專利。

神秘嘉賓

特邀主持

RTE 開發者社群佈道師

孫雨潤

個人簡介:

孫雨潤,RTE 開發者社群佈道師,聲網合夥人兼客戶成功副總裁。畢業於中國科學技術大學計算機專業,曾先後供職 YY、微軟、騰訊。2014 年加入聲網,是早期創業團隊成員之一,目前主要關注電商/秀場/賽事/遊戲/元宇宙等賽道,透過實時互動能力,推動相關場景體驗提升、技術迭代、商業閉環。

掃碼新增小助手微信,備註「0327」進活動群

透過本次活動,我們希望幫助各位小夥伴瞭解背後的技術,並且結交相同興趣的志同道合的朋友~掃碼進群,還可以和本次活動的嘉賓交流溝通哦!

合作伙伴


相關文章