Diffusion 不僅可以更好地模仿,而且可以進行「創作」。
擴散模型(Diffusion Model)是影像生成模型的一種。有別於此前 AI 領域大名鼎鼎的 GAN、VAE 等演算法,擴散模型另闢蹊徑,其主要思想是一種先對影像增加噪聲,再逐步去噪的過程,其中如何去噪還原影像是演算法的核心部分。而它的最終演算法能夠從一張隨機的噪聲影像中生成影像。
近年來,生成式 AI 的驚人增長為文字到影像生成、影片生成領域等許多令人興奮的應用提供了支援。這些生成工具背後的基本原理是擴散的概念,這是一種特殊的取樣機制,克服了以前的方法中被認為難以解決的一些缺點。
最近,來自普渡大學的 Stanley H. Chan 釋出了一份擴散模型的教程《Tutorial on Diffusion Models for Imaging and Vision》,對該方向技術進行了直觀詳盡的解釋。
本教程的目標是討論擴散模型的基本思想,目標受眾包括對擴散模型研究,或應用這些模型正在解決其他問題的本科生和研究生。
文章連結:https://arxiv.org/abs/2403.18103
該教程包括四個部分,涵蓋了最近研究文獻中支援擴散生成模型的一些基本概念:變分自編碼器(VAE)、DDPM(Denoising Diffusion Probabilistic Models)、SMLD(Score Matching with Langevin Dynamics)和 SDE,從多個角度獨立匯出了相同的擴散思想,共長 50 頁。
作者介紹
這篇教程的作者是美國普渡大學電氣與計算機工程學院和統計學系 Elmore 副教授 Stanley H. Chan。
Stanley Chan 2007 年在香港大學獲得學士學位,2009 年、2011 年分別在加州大學聖地亞哥分校獲得數學碩士學位和電氣工程博士學位。2012 年至 2014 年在哈佛大學約翰・A・保爾森工程與應用科學學院擔任博士後研究員。2014 年加入普渡大學。
Stanley Chan 主要從事計算成像研究。他的研究任務是透過共同設計感測器和演算法來構建智慧相機,以實現在所有成像條件下的可視性。
Stanley Chan 還多次獲得論文獎項,包括 2022 年 IEEE 訊號處理學會(SPS)最佳論文獎、2016 年 IEEE 國際影像處理會議(ICIP)最佳論文獎等等。
參考連結:
https://engineering.purdue.edu/ChanGroup/stanleychan.html