ECCV 2018(European Conference on Computer Vision,計算機視覺歐洲大會)與CVPR、ICCV共稱為計算機視覺領域三大頂級學術會議,從今天到14日正在德國慕尼黑舉辦。
騰訊AI Lab 是第二次參加,入選了19篇文章,位居國內企業前列。會議期間,我們選取4篇入選論文做深度解讀,主題依次為影像到影像轉換方法SCAN、影片再定位、單幀RGB生成三維網路模型和跨年齡人臉識別演算法。
在這篇由騰訊 AI Lab 獨立完成的論文中,作者提出了一種正交深度特徵分解演算法OE-CNNs,能顯著提高跨年齡人臉識別精度,以下為論文詳細解讀。
該研究的目的是透過研發新的深度學習模型以提高跨年齡人臉識別的精度。本文提出了一種正交深度特徵分解演算法OE-CNNs,透過把深度特徵正交分解為年齡分量和身份分量,從而將年齡分量和身份分量有效分離開,從而達到減少年齡差異、提高跨年齡人臉識別精度的目標。本文在多個跨年齡人臉識別的國際評測基準(FG-NET, Morph Album 2, CACD-VS)中都取得了國際領先的效能,顯著提高了跨年齡人臉識別的精度。此外,研究者還建立了一個新的跨年齡人臉資料庫CAF以幫助促進跨年齡人臉識別研究。
跨年齡人臉識別是人臉識別領域中的一個極具挑戰性的國際性難題。眾所周知,同一個人的不同年齡階段的圖片會有非常大的差異,這些差異會嚴重影響到跨年齡人臉識別的精度。迄今為止,深度學習已經被廣泛運用到人臉識別,並且取得了非常好的效能。但是,對於跨年齡人臉識別,問題,由於同一個人在不同年齡階段下的多張人臉之間存在著非常顯著的差異,這嚴重影響到現有的深度人臉識別模型的效能。為了克服這個巨大的年齡差異,本文研發了一種新的深度學習演算法,該演算法把深度特徵按照模長方向和角度方向(這兩個方向是彼此正交的)分別分解為年齡成分和身份成分,如下圖所示。
其中,年齡成分被分解成一維徑向分量,而身份成分則分解為高維角度分量。這兩種分量最後透過多工學習的方式同時訓練,最終的損失函式是二者損失的算術疊加:
其中身份成分的損失函式
而年齡成分的損失函式
基於這種新的分解模型研究人員可以把人臉的年齡分量和身份分量有效分離開,並基於身份分量來做跨年齡人臉識別從而有效提高跨年齡人臉識別的精度。
為了進一步提高跨年齡人臉識別效能,本文還採集了一個面向跨年齡人臉識別的的新型人臉資料庫CAF。研究人員透過在網上搜集名人在不同年齡段拍的照片,以保證這些訓練圖片有足夠大的年齡差異。本文的蒐集的人名來源於公共的資訊庫,比如IMDB, Forbes Celebrity, Wikipedia等。本文使用CAF資料庫有4,668個不同的人和這些人的313,000張圖片。這個資料庫的樣例和統計分佈如下圖所示。
實驗結果
在上表的FG-NET跨年齡人臉識別任務中,AI Lab的新演算法OE-CNNs取得了高達53.26%的第一識別率,比第二名的38.21%足足高了超過15%的識別率。
在上表的Morph Album 2識別任務中,AI Lab的演算法也穩定地高於其它所有的人臉演算法。
在上表的對比實驗中,能明顯看出增加了AI Lab新建立的CAF人臉資料做訓練後,對於上表中的所有人臉演算法,它們的識別率都能顯著獲得提升,這證明了CAF對於跨年齡人臉識別研究的幫助和價值。