AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
論文標題:AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers
論文地址:arxiv.org/abs/2411.18673
專案地址:snap-research.github.io/ac3d/
使用 T5 編碼器生成文字嵌入;
透過交叉注意力機制將文字嵌入輸入 VDiT;
在潛空間中採用流擴散引數化技術(Rectified Flow Diffusion)進行生成。