AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文標題:StructLDM: Structured Latent Diffusion for 3D Human Generation
論文地址:https://arxiv.org/pdf/2404.01241 專案主頁:https://taohuumd.github.io/projects/StructLDM 實驗室主頁:https://www.ntu.edu.sg/s-lab
結構化自動解碼:給定人體姿態資訊 SMPL 和相機引數,自動解碼器對訓練集中每個人物個體擬合出一個結構化 UV latent。該過程的難點在於如何把不同姿態、不同相機視角、不同著裝的人物影像擬合到統一的 UV latent 中,為此 StructLDM 提出了結構化區域性 NeRF 對身體每個部位分別建模,並透過全域性風格混合器把身體各部分合並在一起,學習整體的人物外觀。此外,為解決姿態估計誤差問題,自動解碼器訓練過程中引入了對抗式學習。在這一階段,自動解碼器把訓練集中每個人物個體轉化為一系列 UV latent。 結構擴散模型:該擴散模型學習第一階段得到的 UV latent 空間,以此學習人體三維先驗。