2024年5月計算機視覺論文推薦:包括擴散模型、視覺語言模型、影像編輯和生成、影片處理和生成以及影像識別等各個主題

deephub發表於2024-05-25

我們今天總結下2024年5月發表的最重要的論文,重點介紹了計算機視覺領域的最新研究和進展,包括擴散模型、視覺語言模型、影像編輯和生成、影片處理和生成以及影像識別等各個主題。

Diffusion Models

1、Dual3D: Efficient and Consistent Text-to-3D Generation with Dual-mode Multi-view Latent Diffusion

Dual3D是一個新的文字到3D生成框架,可以在1分鐘內從文字生成高質量的3D影像。

https://avoid.overfit.cn/post/f3bbe390f1024ab68fa6f16e44d1305a

相關文章