AIxiv專欄是機器之心釋出學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報導了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯絡報導。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com
這兩點要麼使得在合成的人臉資料集訓練的模型效能表現不佳,要麼難以合成大型資料集。
論文連結: https://arxiv.org/abs/2409.02979
程式碼連結: https://github.com/HaiyuWu/Vec2Face
Demo 連結: https://huggingface.co/spaces/BooBooWu/Vec2Face
此工作提出的 Vec2Face 模型首次實現了從特徵向量生成圖片的功能,並且向量之間的關係,如相似度,和向量包含的資訊,如 ID 和人臉屬性,在生成的圖片上也會得到繼承。 Vec2Face 可以無限生成不同身份 (synthetic ID) 的影像!之前的生成式模型 (GAN, Diffusion model, Stable diffusion model) 最多隻能生成 8 萬個不同身份的影像 [1]。本文利用 Vec2Face 生成了來自於 300K 個人的 15M 張圖片。 用 Vec2Face 生成的 HSFace10k 訓練的模型,首次在人臉識別的年齡測試集 (CALFW) 上實現了效能超越同尺度的真實資料集 (CASIA-WebFace [2])。另外,當合成資料集的 ID 數量大於 100k 後,訓練的人臉識別模型在毛髮測試集 (Hadrian) 和曝光度測試集 (Eclipse) 上也同樣超越了 CASIA-WebFace。
用於縮小合成圖和原圖對於人臉識別模型的相似度: