我們今天總結下2024年5月發表的最重要的論文,重點介紹了計算機視覺領域的最新研究和進展,包括擴散模型、視覺語言模型、影像編輯和生成、影片處理和生成以及影像識別等各個主題。
Diffusion Models
1、Dual3D: Efficient and Consistent Text-to-3D Generation with Dual-mode Multi-view Latent Diffusion
Dual3D是一個新的文字到3D生成框架,可以在1分鐘內從文字生成高質量的3D影像。
https://avoid.overfit.cn/post/f3bbe390f1024ab68fa6f16e44d1305a