相信很多朋友都在網上看到過這樣一張圖:
Oh,不!是這個:
這個:
還有這個:
究竟是什麼,讓原本只有一歲之差的兩個人被 AI 誤會為「形同父子」?是 AI 的「良知泯滅」,還是人類的「自食其果」?
接下來,就讓我們一起來嘮嘮 AI 人臉年齡識別的原理是什麼!
AI 識別技術是什麼?
要說識別與檢測,首先必須談到 AI 識別技術。自從人工智慧概念開始火熱起來,AI 識別應用也是層出不窮,有 AI 人臉識別、AI 自動駕駛道路識別、AI 農作物管理識別,甚至在垃圾分類推行後,又推出了 AI 垃圾分類識別等應用。
而人臉年齡識別,則是在 AI 人臉識別技術的基礎上建立而得。總體來看,人臉識別演算法的組成主要包含三部分,即:
-
人臉檢測(Face Detection)
-
人臉對齊(Face Alignment)
-
人臉特徵表徵(Feature Representation)
人臉檢測模組在於重點處理「人臉定位」問題;人臉對齊則是實現「人臉變換」,得到統一角度與姿態的人臉;而人臉特徵表徵則是對人臉細節進行識別與處理,我們所要得到的人臉年齡識別功能也是在這一階段進行實現。
所以,開篇提到的人臉識別結果還真不能怪 AI 呢,AI 也是本分的老實人,只是根據識別規則處理圖片啦。但由此可以看得出,人臉識別技術確實還不夠成熟。
解人臉識別前世今生
儘管現在我們看來人臉識別技術還存在技術上、安全上的隱患,但實際上人臉識別演算法的發展,已經經歷了 3 個階段,包括:早期演算法階段、人工特徵設計階段、深度學習階段。
早期演算法階段20 世紀 60 年代,人臉識別工程化應用研究開啟。早期的演算法主要利用了人臉的幾何結構進行辨識,透過將人臉影像當做高維的向量進行投影實現對不同人產生不同的區分度。
人工特徵設計階段隨著機器學習理論的發展,研究者們相繼探索出了基於遺傳演算法、支援向量機(Support Vector Machine,SVM)、boosting、流形學習、稀疏表達(Sparse Representation)以及核方法等進行人臉識別。其中的關鍵在於人工特徵的設計,可以有效解決人臉姿態、表情發生變化時,精度嚴重下降的情況。
深度學習階段近年來,由於深度學習的不斷髮展,研究者利用卷積神經網路(CNN)對海量的人臉圖片進行學習,然後對輸入影像提取出對區分不同人的臉有用的特徵向量,替代人工設計的特徵。自此,Gabor 及 LBP 特徵描述子成為人臉識別領域最為成功的兩種人工設計區域性描述子,研究者們也一直在改進網路結構,擴大訓練樣本規模,不斷提高 LFW 上的識別精度。
人臉識別意義
就像開篇所談,將人臉識別作為娛樂工具,也確實會給我們帶來很大的樂趣。但如果只是單純將這個技術用於娛樂大眾,那實在是對技術的浪費!
人臉識別的目標是確定一張人臉影像的身份,這是機器學習和模式識別中的分類問題。它不但可以用在身份識別和身份驗證中,幫助找尋失蹤人口、追蹤嫌疑人、智慧互動身份識別等場景;而且在證件查詢、出入考勤查驗、身份驗證解鎖、支付等場景中,也有廣泛的應用,併為我們的生活帶來極大的便利。
而且就在最近,深圳警方利用跨年齡人臉識別技術,根據一張 3 歲孩童的兒童照片找回了失蹤了十幾年的孩子,讓失散的家庭得以團聚。這都是科技為我們生活帶來的積極作用!
人臉年齡識別挑戰賽
正是因為人臉識別技術應用十分廣泛,且於生活生產具有重大意義。我們也在 AI 研習社(社群)內,發起了人臉年齡識別挑戰賽。
透過這一比賽,參賽者不光可以從人臉識別中年齡單項切入,進行更深度的研究,同時這一比賽我們也給出了 5000+ 的豐厚獎金池。我們也非常希望透過這類比賽,能在一定程度上對人臉識別技術產生推動作用。
本次比賽給定資料集包含了大量的 1-70 歲人臉面部影像,而參賽者的目標也非常簡單——利用訓練模型準確推測出人臉的年齡即可。
資料集下載連結:
評審標準
最終提交結果檔案如下所示:
其中,第一個欄位位為測試集圖片 ID,第二個欄位為推測年齡(三位欄位)。
整個比賽的評審完全透明化,我們將會對比選手提交的 csv 檔案,確認正確分辨圖片樣本,並按照如下公式計算得分,其中:
True:模型分類正確數量
Total :測試集樣本總數量
我們的工作人員也會在每日 24:00,將最新結果更新在官網排行榜上,你可以實時檢視自己的排名情況。
更多資訊,請點選參賽地址檢視: