爆料!傳阿里人靠臉吃飯,真相是......

阿里技術_發表於2018-11-27

640?wx_fmt=png

阿里妹導讀:影像識別是機器智慧的一個重要領域。影像識別使得機器能夠“看”事物,甚至包括人類無法看到的事物。本週,阿里妹將陸續推出數個“影像識別”方向的阿里技術實踐案例,和大家一起發現影像演算法之美。


從進出辦公大樓到會議室,從取快遞到食堂吃飯,只需對準攝像頭刷一下臉,就能輕鬆完成通行、支付、取件等操作。在阿里巴巴,“臉”已經成為員工日常生活辦公的通行證。

 

640?wx_fmt=png

阿里園區食堂使用人臉支付

 

作為園區“刷臉”的主要技術支援方,阿里巴巴資訊平臺事業部園區大腦技術團隊負責人楊含飛(花名:少昊)表示,今年1月初,第一臺人臉閘機才正式在園區落地。而現在,“人臉”已經運用在阿里園區的方方面面,平均每天會進行20多萬次的人臉識別。

 

此外,隨著會議活動對安防要求的增加,一些大型展會對人臉識別的需求也變得越來越強烈。在今年9月雲棲大會上,阿里內部的這套人臉閘機,支援現場12萬人次的通行。

 

640?wx_fmt=gif

雲棲大會上的人臉門禁

 

那麼,在這些大規模的人員識別場景中,阿里內部的人臉識別究竟是如何做保障的?

今天,我們邀請少昊親自揭祕阿里巴巴人臉識別的優化方案。

 

640?wx_fmt=png


人臉識別時,首先需要對方提供一張照片進行人臉註冊,然後在識別過程中,通過終端照片去檢測當前畫面照片上是否有人臉出現。如果有就會去提取特徵並與服務端演算法進行對比,來確認兩者之間是否一致。可見,人臉識別實際上是特徵的“提取”與“對比”。

 

少昊認為,在這一過程中,特徵提取是否完整與充分,對比是否快速準確,與識別演算法、終端軟硬體以及人臉底庫照片都有關係。所以,資訊平臺在做大型人員識別的優化時,主要從這三個方向入手:

 

終端的優化

 

終端的優化分為硬體與軟體。硬體上,主要針對攝像頭採用寬動態技術,IPS優化,從捕捉畫面前景與背景處理上達到清晰均衡的要求,解決逆光問題,讓人臉識別更加快速有效。


 

640?wx_fmt=png


軟體上,我們主要對拍攝清晰度做管理和控制。一般來說,在捕捉到識別影像後,首先會對每幀影像進行資料監控與評估。在經過資料化打標之後,會給影像進行分類,來考察不同清晰度下的影像通過率。以及不同清晰度與角度下,影像的實際分佈情況。這能有效管控識別速度與識別距離,確保整個識別過程的通行效率。

 

識別演算法的優化

 

誤識率是人臉識別的基礎,所以在識別演算法上,技術人員一是對誤識進行控制;二是對相似度進行管理。

 

因為受演算法效能影響,隨著人臉底庫的增加,演算法效能會逐步降低。如何在識別服務上進行優化,成為人臉識別的一大關鍵。

 

使用者行為產生的大量資料,使資料預測成為可能。比如在杭州進行人臉識別出現誤識別,本人有可能實際上正在北京出差或休假等。所以,如果結合資料演算法模型來準確的預測使用者行為,對人群進行合理區分的話,就能一定程度解決誤識別。

 

基於此,團隊成員在誤識別上進行的第一個優化就是——分組優化。通過特徵細分人群,降低誤識,提高通過率。

 

分組優化首先需要考慮時間與空間因素。如果把一個區域空間圈得越小,未來一定時間內出現在該特定區域內的人也會越少。同時,時效越強,在該區域該時段出現的人臉也會越少。

 

同時,結合實際應用場景,通過業務規則與特點的判斷,以及人臉識別演算法的效能特性,就能更好確認合理的空間、時間以及人數的分組規模情況。

 

以阿里巴巴園區人臉識別取件的分組優化為例。從地域屬性上來看,每個小郵局都是一個固定的空間單元,有具體的位置。從時效性來看,當包裹到達小郵局後,它的主人在一段時間內會去拿包裹。從業務屬性上來看,小郵局是收取包裹快遞的地方。通過這三點屬性,就能基本確定取件場景的分組優化方案。判斷哪些員工會去哪個小郵局的分組中。

 

此外,取件還會存在代領情況。這一情況在業務規則中就沒法確認,需要基於歷史行為去分析,一個包裹被別人代領的可能性是多少,以及被誰代領的可能性更高。然後將這一預判結果加入到人臉識別的分組中。

 

640?wx_fmt=gif

阿里園區小郵局通過人臉取件

 

通過一系列的演算法模型學習優化,提升模型預測的準確性,不斷的改善人員分組質量,目前人臉在支援阿里巴巴園區通行上,誤識率已經有效控制在千分之一左右。

 

除了分組優化外,在面對不同膚色與人種的情況下,團隊還建立了不同種類的演算法模型與底庫。這樣可以針對特定膚色人種的通行率和誤識率,做針對性的優化。

 

人員底庫照片的優化

 

少昊表示,很多時候,人臉識別不成功並不是現場攝像頭或比對演算法出了問題,還是底庫照片的質量太差,導致無法進行人臉識別。除了讓對方重新提供照片影像外,還可以通過演算法進行大小臉檢測、照片校正以及身份核實,來確認本人身份。

 

此外,演算法還可以幫助底庫照片進行自學習。通過人員照片序列的分析後,提取特徵進行圖片聚類分析,隨後再通過圖片質量分析後,對本人身份進行核實,進而完成底庫照片的註冊與特徵提取。

 

通過上述手段優化,在人臉識別通過率保持不變的情況下,誤識率可以降到1‰。

 

今年雙11期間,阿里園區的這套人臉識別技術還應用於雙11作戰指揮室與天貓雙11晚會現場的安防保障。

 

少昊表示,通過人臉屬性識別的進一步豐富,硬體及演算法能力的進一步提升,未來,人臉識別技術將會滿足更多商業場景需求,一個真正的刷臉時代就要來了。



640?wx_fmt=gif

你可能還喜歡

點選下方圖片即可閱讀


640?wx_fmt=jpeg

阿里AI設計師一秒出圖,小撒連連驚呼,真相是...


640?wx_fmt=jpeg

雙11背後的全球數字經濟“作業系統”


640?wx_fmt=jpeg

首次公開!2018雙11技術數字全記錄


640?wx_fmt=jpeg

關注「阿里技術」

把握前沿技術脈搏

相關文章