【新智元導讀】 面部識別或面部識別是計算機視覺中最大的研究領域之一。許多公司都投資於面部識別技術的研究和開發。本文篩選了5篇非常重量級的有關人臉識別的機器學習論文,並提煉出論文最關鍵的資訊。來新智元 AI 朋友圈與AI大咖一起討論吧~
面部識別是計算機視覺中最大的研究領域之一。現在,我們可以使用面部識別來解鎖手機,在安全門上驗證身份,並在某些國家/地區進行刷臉支付。許多公司都投資於面部識別技術的研究和開發,本文將重點介紹其中的一些研究,並介紹五篇有關人臉識別的機器學習論文。
1. 大規模多模式人臉反欺詐的資料集和基準
隨著大量實際應用,人臉識別技術變得越來越重要。從智慧手機解鎖到人臉驗證付款方式,人臉識別可以在許多方面提高安全性和監視能力。
但是,該技術也帶來一些風險。可以使用多種面部欺詐方法來欺詐這些系統。因此,面部防欺詐對於防止安全漏洞至關重要。
為了支援面部反欺詐研究,本文的作者介紹了一種名為CASIASURF的多模式面部反欺詐資料集。截止本文撰寫之日,它是最大的面部反欺詐開放資料集。
具體來說,該資料集包括以RGB,深度和IR方式從1000個主題中拍攝的21000個視訊。除了資料集外,作者還提出了一種新穎的多模式融合模型,作為面部反欺詐的基準。
釋出/最近更新– 2019年4月1日
作者和投稿人–Shifeng Zhang (NLPR, CASIA, UCAS, China) , Xiaobo Wang (JD AI Research), Ajian Liu (MUST, Macau, China), Chenxu Zhao (JD AI Research), Jun Wan (NLPR, CASIA, UCAS, China), Sergio Escalera (University of Barcelona), Hailin Shi (JD AI Research), Zezheng Wang (JD Finance), Stan Z. Li (NLPR, CASIA, UCAS, China).。
https://arxiv.org/pdf/1812.00408v3.pdf
2. FaceNet:人臉識別和聚類的統一嵌入
在本文中,作者提出了一種稱為FaceNet的面部識別系統。
該系統使用深度卷積神經網路優化嵌入,而不是使用中間瓶頸層。作者指出,該方法最重要的方面是系統的端到端學習。
該團隊在CPU叢集上訓練了卷積神經網路1000到2000小時。然後,他們在四個資料集上評估了他們的方法。
值得注意的是,FaceNet在著名的野外標記人臉(LFW)資料集上的準確性達到99.63%,在Youtube Faces資料庫上達到95.12%。
釋出/最近更新– 2015年6月17日
作者和撰稿人– Florian Schroff, Dmitry Kalenichenko, and James Philbin, from Google Inc.
https://arxiv.org/pdf/1503.03832v3.pdf
3. 概率臉部嵌入
用於面部識別的當前嵌入方法,能夠在受控設定中實現高效能。這些方法通過拍攝一張臉部影像並將有關該臉部的資料儲存在潛在的語義空間中而起作用。
但是,當在完全不受控制的設定下進行測試時,當前方法無法正常執行。這是由於在影像中缺少面部特徵或模稜兩可的情況。這種情況的一個例子是監視視訊中的人臉識別,其中視訊的質量可能很低。
為了幫助解決這個問題,本文的作者提出了概率面孔嵌入(PFE)。作者提出了一種將現有確定性嵌入轉換為PFE的方法。最重要的是,作者指出,這種方法有效地提高了人臉識別模型的效能。
釋出/最新更新– 2019年8月7日
作者和貢獻者–Yichun Shi and Anil K. Jain, from Michigan State University.
https://arxiv.org/pdf/1904.09658.pdf
4. 人臉識別的魔鬼在噪音中
商湯研究院,加利福尼亞大學聖地亞哥分校和南洋理工大學的研究人員研究了大規模面部影像資料集中的噪聲影響。
由於它們的規模和成本效益,許多大型資料集都容易產生標籤噪聲。本文旨在提供有關標籤噪聲源及其在人臉識別模型中的後果的知識。此外,他們的目標是建立併釋出一個名為IMDb-Face的乾淨人臉識別資料集。
該研究的兩個主要目標是發現噪聲對最終效能的影響,並確定註釋臉部身份的最佳策略。為此,該團隊手動清理了兩個流行的張開面部影像資料集,MegaFace和MS-Celeb-1M。他們的實驗表明,僅在其清理的MegaFace資料集的32%和MS-Celeb-1M清理的資料集的20%上訓練的模型與在整個原始未清理的資料集上訓練的模型具有相似的效能。
釋出/最新更新– 2018年7月31日
作者和貢獻者–Fei Wang (SenseTime), Liren Chen (University of California San Diego), Cheng Li (SenseTime), Shiyao Huang (SenseTime), Yanjie Chen (SenseTime), Chen Qian (SenseTime), and Chen Change Loy (Nanyang Technological University).
https://arxiv.org/pdf/1807.11649v1.pdf
5. VGGFace2:用於識別跨姿勢和年齡的人臉的資料集
關於深度卷積神經網路的面部識別已經進行了許多研究。 反過來,已經建立了許多大規模的面部影像資料集來訓練那些模型。 但是,本文的作者指出,先前釋出的資料集並未包含有關面部姿勢和年齡變化的大量資料。
在本文中,牛津大學的研究人員介紹了VGGFace2資料集。 該資料集包含年齡,種族,照明和姿勢變化範圍廣泛的影像。 資料集總共包含331萬張影像和9,131個物件。
釋出/最新更新– 2018年5月13日
作者和撰稿人–Qiong Cao, Li Shen, Weidi Xie, Omkar M. Parkhi, and Andrew Zisserman, from the Visual Geometry Group at the University of Oxford.
https://arxiv.org/pdf/1710.08092v2.pdf
希望上面有關人臉識別的機器學習論文有助於加深您對該領域工作的瞭解。