早在20世紀50年代,認知科學家就已著手對人臉識別展開研究。20世紀60年代,人臉識別工程化應用研究正式開啟。當時的方法主要利用了人臉的幾何結構,通過分析人臉器官特徵點及其之間的拓撲關係進行辨識。這種方法簡單直觀,但是一旦人臉姿態、表情發生變化,精度則嚴重下降。
20世紀90年代
1991年,著名的“特徵臉”(Eigenface)方法第一次將主成分分析和統計特徵技術引入人臉識別,在實用效果上取得了長足的進步。這一思路也在後續研究中得到進一步發揚光大,例如,Belhumer成功將Fisher判別準則應用於人臉分類,提出了基於線性判別分析的Fisherface方法。
來自100個類(主題)的前四個Fisherfaces。
2000-2012年
21世紀的前十年,隨著機器學習理論的發展,學者們相繼探索出了基於遺傳演算法、支援向量機(Support Vector Machine,SVM)、boosting、流形學習以及核方法等進行人臉識別。
2009年至2012年,稀疏表達(Sparse Representation)因為其優美的理論和對遮擋因素的魯棒性成為當時的研究熱點。與此同時,業界也基本達成共識:基於人工精心設計的區域性描述子進行特徵提取和子空間方法進行特徵選擇能夠取得最好的識別效果。
圖形概要
Gabor及LBP特徵描述子是迄今為止在人臉識別領域最為成功的兩種人工設計區域性描述子。這期間,對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點,比如人臉光照歸一化、人臉姿態校正、人臉超分辨以及遮擋處理等。
3種圓形的LBP運算元
也是在這一階段,研究者的關注點開始從受限場景下的人臉識別轉移到非受限環境下的人臉識別。LFW人臉識別公開競賽(LFW是由美國馬薩諸塞大學釋出並維護的公開人臉數集,測試資料規模為萬)在此背景下開始流行,當時最好的識別系統儘管在受限的FRGC測試集上能取得99%以上的識別精度,但是在LFW上的最高精度僅僅在80%左右,距離實用看起來距離頗遠。
2013年
微軟亞洲研究院的研究者首度嘗試了10萬規模的大訓練資料,並基於高維LBP特徵和JointBayesian方法在LFW上獲得了95.17%的精度。這一結果表明:大訓練資料集對於有效提升非受限環境下的人臉識別很重要。然而,以上所有這些經典方法,都難以處理大規模資料集的訓練場景。
2014年前後
隨著大資料和深度學習的發展,神經網路重受矚目,並在影像分類、手寫體識別、語音識別等應用中獲得了遠超經典方法的結果。香港中文大學的Sun Yi等人提出將卷積神經網路應用到人臉識別上,採用20萬訓練資料,在LFW上第一次得到超過人類水平的識別精度,這是人臉識別發展歷史上的一座里程碑。
論文下載連結:
https://www.aminer.cn/archive/hybrid-deep-learning-for-face-verification/53e9a51db7602d9702e4193c
自此之後,研究者們不斷改進網路結構,同時擴大訓練樣本規模,將LFW上的識別精度推到99.5%以上。人臉識別發展過程中一些經典的方法及其在LFW上的精度,都有一個基本的趨勢:訓練資料規模越來越大,識別精度越來越高。
AMiner 唯一官方微信公眾號:學術頭條(ID:SciTouTiao)。
AMiner 官方網站 網站 https://www.aminer.cn/