AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
該文章的第一作者帥欣成,目前在復旦大學FVL實驗室攻讀博士學位,本科畢業於上海交通大學。他的主要研究方向包括影像和影片編輯以及多模態學習。
論文題目:A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models 發表單位:復旦大學 FVL 實驗室,南洋理工大學 論文地址:https://arxiv.org/abs/2406.14555 專案地址:https://github.com/xinchengshuai/Awesome-Image-Editing
Tuning-based inversion透過原有的 diffusion 訓練過程將源影像集合植入到擴散模型的生成分佈中。形式化過程為: