【蜂口 | AI人工智慧】人臉顏值——龍鵬 深度學習與人臉影像應用連載(五)

絵飛的魚發表於2018-10-09

這次繼續給大家帶來人臉影像相關的分享。 本次的分享主題是 人臉 的顏值。 這次的分享將從三個方面:

首先,我們對 人臉 的顏值,包括 對它的定義和量化標準做一個簡單的介紹。

其次,我們對 顏值 相關的特徵,主要是面部的形狀、 面部的紋理特徵 做一個介紹。 這兩部分特徵將是 顏值 演算法的核心。

最後,我們對人 臉顏值 在當前環境下的應用以及它的難點做一個簡 的介紹。

首那麼我們看第一部分。 時下就是一個顏值就是正義的時代, 大家都已經習慣了看俊男靚女, 正所謂長得好看的人運氣好。

上面是一次韓國選美大賽的一些截圖。 我們可以看到韓國是一個整容業非常發達的國家。 這一些選美大賽選手的照片,作為一個標準的程式 來說, 他又是臉 ,是根本就無法區分這 誰是 誰的臉, 就算讓我再看一百次,我也永遠都記不住這 誰是 誰的臉!  不得不感嘆韓國的整容醫生真的非常的專業專一。

上面這張是一次網路直播的圖片。 我在百度搜尋引擎裡面搜了一些關鍵詞, 可以看到,其實也有非常多的相似性。

當下網路直播是非常火的。 時下中國人審美其實已經完全是趨於一致的, 大家都喜歡瓜子臉的臉型, angla baby、 范冰冰這樣的臉型是最受大家歡迎的, 所以說才會有那麼多的網路主播跑到韓國去整容。

那麼顏值到底應該怎麼樣科學的去給他做定義呢 首先,英國的一 科學家們做了一個平均 的測試。 他們從全球蒐集了很多的圖片,對每一個國家的女性的圖片, 透過簡單的影像融合 影像加權,最後得到了一些人臉影像的照片。

上圖這是亞洲幾個國家的人臉平均值,分別是男生和女生。 我們可以看到 : 平均 其實顏值都挺高的。 雖然這項研究也得到了很多人的詬病, 就是他們認為人臉的平均 其實沒有那麼顏值高, 但是這個研究總歸它反映了一個問題,就是一句俗語: 人一個 醜人多作怪。

因為我們可以看到這 三個國家的平均 其實也非常的相似。 那麼我們在實際研究 顏值 這個問題的時候, 我們應該怎麼樣去標註

實際上現在能用的 顏值 資料集是非常少的, 可以說基本上公開資料 幾乎沒有。

上面這張圖是一個包含5500張影像, 其中有 2000個亞洲女性和 2000個亞洲男性的一個資料集, 是今年才剛剛整理出來的。 也是現在目前可以公開獲取的一個最大的資料集。 將人臉顏值分為五個等級,即 從零分到五分。 我們可以看到這個五分的等級, 基本上對應的就是一些明星。

而實際上現在各家公司像 face++、商湯科技, 或者說其他做人臉演算法的小組,他們標註資料都是透過自己內部的資料集和標註人員,其實他們的審美標準也是不一樣的,導致每一家出來的演算法其實都有很大的區別,甚至不具備可比性。

但是為了研究人臉顏值這個問題,我們還是要給他提一些比較 魯棒 的特徵。 人的顏值特徵主要包含兩塊: 幾何特徵 皮膚紋理。

幾何特徵:所謂幾何特徵就是臉型。 我們可以看到人臉兩個眼睛的距離, 臉的外輪廓的距離,左右的距離以及 上下的距離,其實都能夠反映這樣一個臉型。

前面我們已經說過了, 現在大家都比較喜歡瓜子臉的臉型, 認為瓜子臉這個顏值 是比較高的, 而方形臉 圓形臉這樣的 臉型 其實是不太會被大家認為是高顏值的臉型。 臉型是非常重要的一個因素。

皮膚紋理: 紋理特徵的話可以有LBP特徵 Gabor特徵等等。 我們經常會在一些娛樂八卦新聞雜誌上看到某某女明星過生日, 她的同齡人來了多少多少女性, 然後一張照片放出來, 你會發現完全看不出來是同一個年齡階段的人。

另外一個,現在的美顏演算法, 也就是對人臉的皮膚進行磨皮等等處理。 可以看到經過美顏之後的人臉顏值瞬間提升。

所以幾何特徵跟皮膚特徵 是人類 顏值 重要的 兩塊特徵。 在利用傳統方法做研究的時候, 我們會去手動的提取這樣的特徵; 在利用深度學習的方法來做 顏值 演算法的時候, 實際上就是利用深度學習去自動的學習到這些特徵。

而每一家公司每一個 人臉 小組他們所做的, 實際上就是標註出這樣一批資料,資料量越大越好, 標註的資料的偏差越小越好。

的顏值相對來說是一個比較簡單的問題,下面 我們對它的應用和難點做一個簡單的介紹:

首先,在現在的主播推 中有一定的市場。 總體來說大家還是比較喜歡顏值高的主播, 所以像陌陌等等這樣的一些平臺, 會可以利用顏值演算法對主播進行一些推薦。

其次,智慧自拍。 selfier 就是google開發的一個APP, 會在自拍模式下自動地抓拍 比較好的一個角度。

上面這個圖是一個人臉顏值研究的資料集。 我們可以看到不同的自拍角度其實是非常影響顏值的。

顏值演算法對於智慧自拍也是有一定作用。 人的顏值相對來說是比較開放的問題, 它沒有定量的標準。所以再加上大家的審美標準不一, 就是同一個人,他在標註資料的時候, 它一樣存在著很大的偏差, 這是導致人臉顏值演算法比較難以量化, 甚至不同的演算法之間難以進行公平比較的一個 原因 ,也是 一個比較重大的原因。 但是不管怎麼說,人臉顏值仍然是一項比較有趣味性的研究。

大家實際上對人臉 顏值 這樣一個演算法不用非常嚴肅的對待, 就當做是一個比較好玩的課題吧

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31553577/viewspace-2215774/,如需轉載,請註明出處,否則將追究法律責任。

相關文章