從去年開始,針對LLM的研究成為了大家關注的焦點。但是其實針對於計算機視覺的研究領域也在快速的發展。每週都有計算機視覺領域的創新研究,包括影像識別、視覺模型最佳化、生成對抗網路(gan)、影像分割、影片分析等。
我們今天來總結一下2024年3月上半月份發表的最重要的論文,無論您是研究人員、從業者還是愛好者,本文都將提供有關計算機視覺中最先進的技術和工具重要資訊。
Diffusion Models
1. OOTDiffusion: Outfitting Fusion-based Latent Diffusion for Controllable Virtual Try-on
Outfitting over Try-on Diffusion (OOTDiffusion),利用預訓練的潛在擴散模型的力量,設計了一種新穎的網路架構,可以現實和可控的虛擬試穿。論文提出了一個outfitting UNet來學習服裝細節特徵,並透過擴散模型去噪過程中的outfitting融合將其與目標人體融合。
在訓練過程中引入了服裝dropout,能夠透過無分類器的指導來調整服裝特徵的強度。在VITON-HD和Dress Code資料集上的綜合實驗表明,OOTDiffusion可以有效地為任意人體和服裝影像生成高質量的服裝影像,
https://avoid.overfit.cn/post/3c01305dabf4473ca29bfea2e74f3473