人臉識別:技術應用與商業實踐

dicksonjyl560101發表於2019-08-12


人臉識別,已成趨勢。關於人臉識別各種碎片式的報導也層出不窮,但對於大多數人而言,依然是管中窺豹,霧裡看花。本篇文章中,筆者將從技術應用與商業模式兩個維度,系統性地說明人臉識別,力求讓讀者,尤其是在考慮AI+應用的從業者,看到全貌。

根據前瞻產業研究院對對人臉識別市場的預估,到2022年,中國人臉識別市場規模將超過66億元。

人臉識別:技術應用與商業實踐

本篇,我們先來講人臉識別的技術應用。

基礎能力決定上層應用——基礎層演算法

我們可能斷斷續續聽說過人臉檢測、人臉識別等演算法,但這些演算法之間是否有聯絡,是否有體系?答案的是“有的”。

我們可以將人臉識別演算法分為基礎層演算法與應用層演算法。

人臉識別:技術應用與商業實踐

基礎層演算法,相當於人臉的預處理。一張人臉,首先要經過人臉檢測、特徵關鍵點處理,質量模型過濾之後,才能到應用層演算法做處理,並應用到實際場景中。

基礎層演算法的優劣,很大程度上會影響最終的人臉識別準確率和效果。

人臉識別:技術應用與商業實踐

人臉識別:技術應用與商業實踐

應用落地,各取所需——應用層演算法

目前,人臉識別在身份認證領域與互娛領域應用最為廣泛;在智慧互動,資料分析處理等方向上,人臉識別也在進行著積極探索。

身份認證/安防的核心功能在於確認“你是誰”,互娛領域的核心在於“人臉特效處理”; 兩個領域,兩條賽道,分別擁有各自不同的產業鏈。

身份認證猶如一位思維嚴謹的工程師,狠抓識別準確率,防攻擊等指標,並結合應用落地場景,串聯業務流程,也是當下AI結合產業網際網路的典型。

互娛領域就像一位鑽研人性的產品經理,打造各種人臉特效,美顏、貼紙等都不在話下,並結合平臺使用者偏好,使用針對性的人臉特效策略,引領甚至塑造人們的審美潮流。

人臉識別:技術應用與商業實踐

1. 你是誰?無介質證明身份

日常生活中,原來我們都是需要通過介質(身份證、工牌、駕駛證等)來證明身份,而以人臉識別為代表的生物識別,則無需介質。

身份認證/安防的核心技術在於活體檢測、人臉比對、人臉搜尋;主要用於:線上遠端認證場景(金融開 戶、刷臉註冊、刷臉登入等)、線下無人值守場景(智慧交通、人臉門禁、刷臉取款、刷臉支付等)。

(1)活體檢測

是身份認證的第一步,因為首先我要確認這個人是真人,而不是視訊、照片、面具等欺詐盜用行為。

活體檢測的技術上,目前也主要有兩大類:

  1. 對硬體依賴度比較低的,如動作活體,靜默活體;
  2. 對硬體有一定要求,需要和硬體適配的,比如雙目活體、3D結構光活體等。

雖然後者的成本比前者高,但是防攻擊效果更好,而線上下場景中,天然的需要硬體,因而後者也成為線下場景的最好選擇。

原理上,都是採集人臉照片,並將照片做上標記(真/假樣本),並送到模型中訓練從而得出演算法。

不同的活體檢測,因為樣本源不一樣,比如紅外攝像頭採集的照片,帶有黑白特徵;3D結構光采集的照片帶有深度資訊,導致識別效果也不同。

所以,活體檢測的關鍵,除了演算法、模型構造,還有一個就是圖片樣本本身所帶有的資訊量。

(2)人臉比對

是將兩張人臉照片進行比對,得出相似度;第一張是現場採集的,第二張該如何得來?一般有兩個來源:

  1. 能代表你身份的載體,比如身份證、行駛證、駕駛證等證件照,這類場景用來做金融開 戶、人臉註冊、網約車司機認證等場景,通過現場採集照比對你的證件照資訊,確認你就是本人;
  2. 賬號下已經繫結的人臉:一般需要先輸入賬號,獲取對應人臉。這類場景的典型應用是取代原來的密碼功能,比如刷臉登入、刷臉支付等。

(3)人臉搜尋

是將採集到的人臉,和底庫中的人臉全部進行比對,得出相似度最高的幾張人臉底庫照,並得出相似度,超過一定閾值,則可以認為是同一人。

人臉搜尋,無需事先得到底庫人臉照,只需要刷臉即可,線上下門禁、安防、刷臉支付等領域應用廣泛。當然,不同的業務領域中,根據誤識的後果,對人臉搜尋的容錯性也不一樣;比如在工地人臉識別中的容錯率,就要比在刷臉支付中的容錯率要低。

需要說明的是,人臉搜尋的準確率,是要結合底庫中人臉照片的數量來的,底庫中人臉照片越多,識別準確率越低。

這個和人一樣,在2~3個人中,找出你曾經認識的人,比較容易;但是上百萬個人,則長相相似的人也越多,辨識更困難。目前業界做的好的一般是百萬級別的人臉庫,識別準確率在95%以上。

2. 從工具到社交,娛樂至上

互娛應用,也深深契合著行業發展。起初隨著智慧手機興起,人們的自拍分享需求漸漸旺盛,美顏濾鏡,作為與手機硬體深度結合的產品,見證著人們變美的時代,此時,演算法主要由第三方演算法公司提供。

隨著4G時代帶來,短視訊社交成為人們生活熱點,美顏濾鏡、貼紙也應用於各大互娛平臺中,併成為不可分割的一部分;對於短視訊內容生產者來說,甚至已成為核心競爭力。

因此,諸如快手、抖音等平臺,都以自研演算法,並結合客戶群畫像,獨自研發。

(1)濾鏡美顏

濾鏡是影象美化中必不可少的步驟, 所謂濾鏡,最初是指安裝在相機鏡頭前過濾自然光的附加鏡頭,用來實現調色和新增效果。2008年,美圖一炮而紅,人們發現,原來濾鏡還可以這麼玩,自此, 美顏濾鏡開始了從工具到美學定義者的轉變。

早期的傳統演算法,主要是先使用人臉特徵關鍵點演算法,勾畫有效區域,然後在不同的區域進行亮度提升、去噪聲等演算法,實現美顏濾鏡。

隨著深度學習的興起,研究人員們開始更關注結果,設計師將原圖P成美化完成後的結果圖,並用於訓練。人們美顏後,究竟想變成什麼樣?研究重心也開始偏移。

(2)人臉融合與貼紙

貼紙,人臉融合,則是更高階的玩法。核心還是人臉特徵關鍵點,對於貼紙和人臉融合來說,關鍵點的數量越多越好,對齊的越準確。人臉融合,則是將兩張人臉的關鍵點進行融合。

人臉識別:技術應用與商業實踐

3. 不斷進取,跨越感知智慧

人工智慧承載了業界對於改造世界的期望,一定程度上說,屬性識別、視線估計、GAN等,從感知智慧往前更進了一步,但是因為技術不夠成熟、商業應用領域狹窄等原因,至今未得到大規模商業應用。

可以說,視覺AI想跨越到認知智慧,AI與AI之間相互融合,依然還有很漫長的路要走

(1)屬性識別

年齡、性別,高興、悲傷、憤怒等情緒,獲取使用者更多維的資料,豐富使用者畫像,用於個性化推薦、廣告展示等場景,聽著很美好,對不對?畢竟在資料為王的時代,資料就是價值。但是,商用化還是存在技術硬傷,識別準確率也就70%左右。

近日,美國等5名專家,耗時兩年,查閱1000多項研究,在論文《再論人類情感表達:從人類面部表情辨別情緒的方法論面臨的挑戰》(論文原名為:《Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements》)中表示:人類情緒的表達方式及其豐富複雜,很難靠簡單的面部表情識別,人們生氣時,在平均不到30%的時間裡他們會皺眉,故皺眉不等於憤怒,皺眉只是“憤怒”的眾多表達方式之一。同時,表情和語言、情境的相關關係也非常大。

(2)視線估計

視線估計與人臉特徵關鍵點比較像,檢測完人臉之後,再檢測人眼以及眼球,並鎖定眼球中心等關鍵點位置,根據座標來鎖定視線方向。主要應用於課堂上,評估學生注意力;

AR VR等新型硬體互動,通過視線方向,自動切換視訊中的位置等;廣告投放,評估行人對廣告的注意力;目前而言,市場體系還是比較小,未得到大規模應用。

(3)GAN

GAN全稱為生成對抗網路,初衷是生成不存在於真實世界中的資料,使得AI具有創造力或者想象力,也是目前AI領域一個比較熱門的研究方向。

GAN的核心網路分為生成器與判別器;生成器負責憑空捏造資料,判別器負責判斷資料是否是真實資料;兩個核心網路相互博弈,直至動態平衡,讓生成的資料無限接近與真實資料。

人臉識別:技術應用與商業實踐

如圖,隨機噪聲就是隨機生成的一些數,也就是GAN生成影象的源頭。

生成器根據一串隨機數生成一個假影象,並用這些假圖去欺騙判別器

而判別器通過真圖和假圖的資料(相當於天然的label),進行一個二分類神經網路訓練,並判別輸入的是真圖還是假圖,給出一個分值。

舉個例子,真圖是一系列的人臉照。起初,生成器生成的照片,肯定是亂七八糟的,但是判別器會去判斷打分,告訴生成器,你生成的不是真圖(人臉照),於是生成器根據深度學習,反向傳播等,不斷去修改自己的圖片,然後,生成的圖片會越來越趨近於真實人臉,直至動態平衡。

GAN受到關注,很多原因,比如:

  1. 本身是無監督的,目前人工智慧的絕大部分能夠商業應用演算法都是監督演算法,所謂監督演算法,就是需要海量的樣本,並進行人工標註,傳播訓練,所以行業也有“有多少人工,就有多少智慧”的調侃;
  2. 讓AI具備想象力,比如將模糊圖變清晰(去雨、去霧、去抖動、去馬賽克等),能腦補情節 很多paper都在研究gan的發展前景。

結語

任何技術,也都遵循著從技術發展—>技術成熟—>商業落地的發展規律。技術的池子不斷創新,同時商業也從技術池中,探索合適的技術,改造世界;

人臉識別作為一項複合性技術,既擁有現在,同時也在不斷開拓未來。雖然困難重重,但前景令人心動。

 

作者:雲識客,公眾號: 雲識客(ID: zhiquysk),立足視覺AI,專注場景識別的AI服務商

本文由 @胡安安 原創釋出於人人都是產品經理。未經許可,禁止轉載


http://www.woshipm.com/ai/2693074.html

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2653379/,如需轉載,請註明出處,否則將追究法律責任。

相關文章