AMiner今日已釋出《人臉識別研究報告》
特徵臉技術是近期發展起來的用於人臉或者一般性剛體識別以及其它涉及到人臉處理的一種方法。使用特徵臉進行人臉識別的方法首先由Sirovich和Kirby(1987)提出(《Low-dimensional procedure forthe characterization of human faces》),並由Matthew Turk和Alex Pentland用於人臉分類(《Eigenfaces for recognition》)。首先把一批人臉影像轉換成一個特徵向量集,稱為“Eigenfaces”,即“特徵臉”,它們是最初訓練影像集的基本元件。識別的過程是把一副新的影像投影到特徵臉子空間,並通過它的投影點在子空間的位置以及投影線的長度來進行判定和識別。
將影像變換到另一個空間後,同一個類別的影像會聚到一起,不同類別的影像會聚力比較遠,在原畫素空間中不同類別的影像在分佈上很難用簡單的線或者面切分,變換到另一個空間,就可以很好的把他們分開了。
Eigenfaces選擇的空間變換方法是PCA(主成分分析),利用PCA得到人臉分佈的主要成分,具體實現是對訓練集中所有人臉影像的協方差矩陣進行本徵值分解,得到對應的本徵向量,這些本徵向量就是“特徵臉”。每個特徵向量或者特徵臉相當於捕捉或者描述人臉之間的一種變化或者特性。這就意味著每個人臉都可以表示為這些特徵臉的線性組合。
區域性二值模式(Local Binary Patterns,LBP)
區域性二值模式(Local binary patterns LBP)是計算機視覺領域裡用於分類的視覺運算元。LBP,一種用來描述影像紋理特徵的運算元,該運算元由芬蘭奧盧大學的T.Ojala等人在1996年提出(《A comparative study of texturemeasures with classification based on featured distributions》)。2002年,T.Ojala等人在PAMI上又發表了一篇關於LBP的文章(《Multiresolution gray-scale androtation invariant texture classification with local binary patterns》)。這一文章非常清楚的闡述了多解析度、灰度尺度不變和旋轉不變、等價模式的改進的LBP特徵。LBP的核心思想就是:以中心畫素的灰度值作為閾值,與他的領域相比較得到相對應的二進位制碼來表示區域性紋理特徵。
LBP是提取區域性特徵作為判別依據的。LBP方法顯著的優點是對光照不敏感,但是依然沒有解決姿態和表情的問題。不過相比於特徵臉方法,LBP的識別率已經有了很大的提升。
Fisherface
線性鑑別分析在降維的同時考慮類別資訊,由統計學家Sir R. A.Fisher1936年發明(《The useof multiple measurements in taxonomic problems》)。為了找到一種特徵組合方式,達到最大的類間離散度和最小的類內離散度。這個想法很簡單:在低維表示下,相同的類應該緊緊的聚在一起,而不同的類別儘量距離越遠。1997年,Belhumer成功將Fisher判別準則應用於人臉分類,提出了基於線性判別分析的Fisherface方法(《Eigenfaces vs. fisherfaces:Recognition using class specific linear projection》)。
經典論文
Sirovich,L.,&Kirby,M.(1987).
Low-dimensional procedure for the characterization of human faces.
Josa a,4(3),519-524.
研究證明任何的特殊人臉都可以通過稱為eigenpictures的座標系統來表示。Eigenpictures是面部集合的平均協方差的本徵函式。
Turk,M.,&Pentland,A.(1991).
Eigenfaces forrecognition.
Journal of cognitive neuroscience,3(1), 71-86.
研究開發了一種近實時的計算機系統,可以定位和追蹤人的頭部,然後通過比較面部特徵和已知個體的特徵來識別該人。該方法將面部識別問題視為二維識別問題。識別的過程是把一副新的影像投影到特徵臉子空間,該特徵空間捕捉到已知面部影像之間的顯著變化。重要特徵稱為特徵臉,因為它們是面集的特徵向量。
Ojala,T.,Pietikäinen,M.,&Harwood,D.(1996).
Acomparative study of texture measures with classification based on featureddistributions.
Pattern recognition,29(1),51-59.
研究對不同的圖形紋理進行比較,並提出了用來描述影像紋理特徵的LBP運算元。
Ojala,T.,Pietikainen,M.,&Maenpaa,T.(2002).
Multiresolutiongray-scale and rotation invariant texture classification with local binarypatterns.
IEEE Transactions on pattern analysis and machineintelligence,24(7),971-987.
研究提出了一種理論上非常簡單而有效的灰度和旋轉不變紋理分類方法,該方法基於區域性二值模式和樣本和原型分佈的非引數判別。該方法具有灰度變化穩健、計算簡單的特點。
Fisher,R.A.(1936).
The use of multiple measurementsin taxonomic problems.
Annals of eugenics,7(2),179-188.
研究找到一種特徵組合方式,以達到最大的類間離散度和最小的類內離散度。解決方式為:在低維表示下,相同的類應該緊緊的聚在一起,而不同的類別儘量距離越遠。
Belhumeur,P.N.,Hespanha,J.P.,&Kriegman,D.J(1997).
Eigenfacesvs.fisherfaces:Recognition using class specificlinear projection. Yale University New Haven United States.
研究基於Fisher的線性判別進行面部投影,能夠在低維子空間中產生良好分離的類,即使在光照和麵部表情的變化較大情況下也是如此。廣泛的實驗結果表明,所提出的“Fisherface”方法的誤差率低於哈佛和耶魯人臉資料庫測試的特徵臉技術。
AMiner 唯一官方微信公眾號:學術頭條(ID:SciTouTiao)。
AMiner 官方網站 網站 https://www.aminer.cn/