2024智源大會議程公開丨生成模型

新闻助手發表於2024-06-04

2024年6月14日-15日,第6屆北京智源大會將以線下與線上結合的形式召開,線下會場設在中關村國家自主創新示範區會議中心。2024智源大會再次以全球視野,匯聚年度傑出工作研究者,交流新思想,探討新思路,引領新前沿。目前已正式開放報名渠道。

北京智源大會倒數計時:11

生成模型 論壇丨6月15日下午

生成式建模是人工智慧的基礎正規化之一,是邁向通用人工智慧的重要一環。隨著生成式建模方法的快速發展和模型規模的急速增長,以自迴歸模型、擴散機率模型為代表的生成式人工智慧(如GPT系列、Sora、Stable Diffusion等)在文字、影像、影片、跨模態等重要領域取得了一系列突破性進展。本論壇聚焦生成式機率建模的未來發展,邀請到4位生成式人工智慧一線專家學者,分享生成式建模的前沿進展,共同探討如何構建多模態統一的生成式建模方法等重要未來方向。

論壇議程

圖片

論壇主席

圖片

李崇軒,中國人民大學高瓴人工智慧學院副教授

李崇軒,中國人民大學高瓴人工智慧學院副教授、博士生導師,2010-2019年獲清華大學學士和博士學位。主要研究機器學習、深度生成模型,代表性工作部署於文到圖大模型DALL·E 2、Stable Diffusion和文到影片大模型ViDu等。曾獲國際會議ICLR傑出論文獎、吳文俊優秀青年獎、吳文俊人工智慧自然科學一等獎、中國計算機學會優秀博士論文等。入選博新計劃、北京市科技新星,主持、參與多項國家自然科學基金、科技部課題。擔任ICLR 、NeurIPS 等國際會議領域主席。



圖片

陳鍵飛,清華大學副教授

陳鍵飛於2014年和2019年分別在清華大學獲得了電腦科學的學士和博士學位,並在TSAIL組與朱軍教授合作。他的研究興趣包括高效機器學習,特別是量化神經網路、隨機最佳化演算法和機率推理演算法。在過去,他還開發了幾個可擴充套件的主題模型訓練系統。2019年,陳鍵飛 因傑出的工作獲得了CCF優秀博士學位論文獎。他還曾在2009年獲得中國資訊學奧林匹克競賽金牌。2018年,陳鍵飛 共同創立了RealAI,這是他職業生涯中的一個顯著成就。

演講主題及嘉賓介紹(按照發言先後順序)

1、影片生成前沿進展

報告簡介:不同於影像生成,影片生成在內容一致性、長影片生成、計算資源消耗等方面均面臨巨大的挑戰。但是,影片生成仍然在2023年取得了飛速的發展,湧現出Stable Video Diffusion、Runway Gen-2、Video Diffusion Transformer、Sora等優秀模型。本報告首先介紹當前影片生成面臨的挑戰,然後詳細介紹最新的影片生成優秀模型,最後還對影片生成的技術發展進行展望。

圖片


盧志武,中國人民大學教授

盧志武博士,中國人民大學高瓴人工智慧學院教授,博士生導師。2005年畢業於北京大學數學科學學院資訊科學系,獲理學碩士學位;2011年畢業於香港城市大學計算機系,獲PhD學位。研究方向為機器學習與計算機視覺。設計首箇中文通用多模態預訓練模型文瀾BriVL。發表多模態領域首篇Nature子刊論文。早於OpenAI釋出類Sora的影片生成底座VDT。

2、Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

報告簡介:講者將會介紹最新的視覺生成框架Visual AutoRegressive Modeling,基於Visual tokenizer結合transformer實現了Next Scale Prediction,首次使得GPT風格的自迴歸視覺生成,在效果、速度、Scaling能力多方面超越 Diffusion,並迎來了視覺生成領域的 Scaling Laws,本次分享將會帶大家介紹經典的擴散模型以及近期受到大家關注Auto Regressive模型的前沿進展。

圖片江毅,位元組跳動 GenAI 研究員

江毅,位元組跳動 GenAI 研究員,畢業於浙江大學,他的代表性工作有Sparse R-CNN,ByteTrack,UNINEXT等。當前的研究興趣主要是計算機視覺和視覺生成基礎模型的研發,在CVPR,ICCV,NeurIPS,ICLR,ICML,ECCV等會議和期刊上發表論文30餘篇,其中多篇文章被錄用為Oral,Spotlight,他的工作在github開源並累計獲得20K star。

3、視覺生成中的若干問題

報告簡介:近年來,視覺生成模型在人工智慧領域實現了突破性進展,吸引了業內廣泛的關注。然而,隨著技術的發展,該領域亟待解決的關鍵問題亦日益凸顯,呼喚研究者們投入更多精力進行深入探討。本報告旨在梳理並總結該領域面臨的若干重要問題,同時分享作者針對以下課題的初步思考與見解:一、探討生成模型的最終追求;二、視覺訊號拆分問題;三、Tokenizer存在的困境;四、擴散模型的內在衝突問題;五、擴散模型是否是最大似然估計。報告期望這些討論能夠引起學界的重視,併為推動該領域的持續創新與發展貢獻力量。

圖片

古紓暘,微軟亞洲研究院視覺計算組研究員

古紓暘,在中國科學技術大學自動化繫於2017年和2022年分別獲得學士和博士學位,現為微軟亞洲研究院視覺計算組研究員,主要研究方向為計算機視覺中的生成模型。研究興趣主要包括生成對抗網路和擴散模型的理論及應用,探索新一代生成模型,以及生成模型質量評估。目前已在CVPR、ICCV、ECCV等會議上發表多篇論文並擔任多個會議與期刊的審稿人。

個人主頁:https://cientgu.github.io/

4、大模型的高效並行推理方法

報告簡介:AIGC大模型已取得廣泛應用成果,然而其低效的順序推理過程常導致較差的使用者體驗和高昂的部署成本。本次報告將介紹如何從推理演算法的角度改善大模型的推理效率,並探討在模型架構、序列壓縮、快取最佳化等其他方面的加速手段。

圖片

鄧志傑,上海交通大學清源研究院助理教授

鄧志傑,上海交通大學電院清源研究院助理教授,博士生導師。主要研究方向為生成模型、機器學習。以第一/通訊作者在ICML、NeurIPS、ICLR、CVPR等會議和期刊上發表論文20餘篇。獲英偉達先鋒研究獎。研究工作得到國家自然科學基金、上海市科技創新行動計劃、CCF-百川-英博大模型基金等專案支援。

5、圓桌討論

圓桌討論嘉賓:

陳鍵飛丨清華大學副教授(主持人)

盧志武丨中國人民大學教授

江 毅丨位元組跳動 GenAI 負責人

古紓暘丨微軟亞洲研究院視覺計算組研究員

鄧志傑丨上海交通大學清源研究院助理教授

李崇軒丨中國人民大學副教授

即刻掃碼註冊,參與大會報名

本屆大會採用線下與線上模式融合,報名通道已開啟,歡迎掃碼免費註冊。由於線下席位有限,請儘早完成註冊,組委會將根據註冊次序稽核,並在會前傳送稽核結果通知。公開環節將向註冊使用者全程線上直播。

圖片

相關文章