近日,世界權威的人臉檢測公開評測集WIDER FACE公佈最新評測排名。創新奇智(AInnovation)研發的AInnoFace人臉檢測演算法,超越百度、曠視、騰訊、京東、滴滴、卡耐基梅隆大學、北京郵電大學、中國科學院大學等眾多國內外知名人工智慧企業和高校人工智慧實驗室,在WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結果中, 綜合排名第一(六個分項排名中五項第一,一項第二)。
(圖片來自於WIDER FACE官網http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html,為方便讀者閱讀該排行榜,筆者標註了部分人臉檢測演算法的研發企業和高校)
WIDER FACE人臉檢測資料集人臉檢測是計算機視覺領域中非常熱門和非常挑戰的演算法難題。人臉檢測也是人工智慧演算法最重要的商業場景之一。為了提升人工智慧演算法和對外顯示人工智慧技術實力,很多AI公司都會選擇公開資料集來驗證自身的演算法能力。在眾多資料集中,WIDER FACE是目前業界公開的規模最大、檢測難度最高的人臉檢測資料集,由香港中文大學於2016年建立。該資料集共包含32,203張影像和393,703個人臉標註。其中40%的資料為訓練集(Training),10%的資料為驗證集(Validation),50%的資料為測試集(Testing)。每個集合中的資料根據人臉檢測的難易程度分為“Easy”,“Medium”,“Hard”。
WIDER FACE的資料集識別難度非常大,更加貼近現實的場景,典型例子如下圖所示。
從圖片中可以看到,該資料集彙集了劇烈變化的人臉尺寸、各種各樣的拍照角度、人臉姿態變化,不同程度的人臉遮擋、表情變化,不同型別的光照汙染、強弱差異,以及多式多樣的化妝風格等多種影響因素,因此該資料集在全球人臉檢測領域極具挑戰性,每次評測均會吸引多家國內外科技巨頭及高校院所(包含CMU等海內外一流高校,京東、騰訊、百度、華為、IBM、滴滴、曠視等知名AI公司),在該資料集上一較高下。
創新奇智AInnoFace演算法
創新奇智提出的AInnoFace演算法以著名的一階段檢測器RetinaNet為起點,採用了IoU損失函式(IoU regression loss)進行邊框迴歸使得檢測結果的位置更加精準,使用了選擇性二階段迴歸和分類(Selective Refinement Network)讓檢測結果的召回率更高並且產生的虛檢更少,融合了多種資料増廣策略使得最終的檢測模型更加魯棒,借鑑了標籤最大化操作(Max-out Label)讓分類預測結果更加準確從而降低虛檢,利用了改進的多尺度測試策略以更好地檢測不同尺度的人臉。經過上述一系列改進,AInnoFace演算法對極端尺寸、模糊、遮擋等姿態下的人臉都有很好的檢測效果,能有效提升複雜場景下人臉檢測召回率及精準度,更好地解決了開放場景人臉檢測的技術難題。
AInnoFace人臉檢測演算法構建在RetinaNet網路的基礎上。(a)骨幹網路:前饋ResNet-152 網路架構用來提取多尺度特徵圖。(b)頸部網路:一個6級特徵金字塔網路(FPN)用來生成更豐富的多尺度卷積特徵金字塔,在這之後,連線兩個共享子網,一個子網負責分類目標框,另一個網路負責將目標框迴歸到真實框。 最後,我們使用focal-loss作為二分類的損失和使用IoU loss 作為框迴歸的損失。詳細資訊請參考論文《Accurate Face Detection for High Performance》https://arxiv.org/pdf/1905.01585.pdf
以曾經有“世界上人數最多的自拍合影”照片為例,從公開訊息查詢(http://tech.ifeng.com/a/20180329/44924067_0.shtml)百度的演算法PyramidBox在該圖片上檢測到880張人臉,而AInnoFace演算法可以檢測出918張人臉,檢測精度遙遙領先,來感受一下AInnoFace演算法的威力吧!
具體到本次競賽的各項指標,如下圖所示 ,也可以在官方主頁中查到(http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)。在眾多知名人工智慧企業、高校人工智慧實驗室中,創新奇智脫穎而出,奪得冠軍,令業界印象深刻!
厚積薄發,快速發展
WIDER FACE競賽高手大咖雲集,成立一年多的創新奇智力壓群雄獲得第一。這並不是偶然,而是與創新奇智優異的商業化能力和優異的技術研發團隊密不可分。
創新奇智成立於2018年3月,是創新工場的AI子公司,以“人工智慧賦能商業未來”為使命,致力於用最前沿的人工智慧技術為企業提供AI相關產品及商業解決方案。創新奇智CEO徐輝在IT行業擁有20餘年的銷售、產品、技術、服務、管理經驗,歷任IBM、微軟、SAP等多家世界500強科技巨頭企業高管,對中國市場各個行業發展有著深入瞭解。創新奇智採用 “技術產品”+“行業場景”雙輪驅動模式,商業化速度飛快。
創新奇智擁有優異的技術研發團隊,本次WIDER FACE競賽奪冠隊伍由張發恩、範馨予、艾國、宋劍飛、秦永強和吳佳洪組成。其中團隊Leader張發恩現任創新奇智CTO、創新工場人工智慧工程院首席架構師和寧波諾丁漢大學榮譽教授,他在人工智慧工業界和學術界成績不菲,曾任職Microsoft、Google和百度,持有多項國內外人工智慧演算法專利和發表過數篇人工智慧頂級會議論文。隊伍中其他成員也都有著深厚的人工智慧教育背景和從業經歷。
創新奇智自成立伊始就瞄準高精尖的人工智慧演算法在零售、製造、金融等多個領域的商業化產品落地,重點突破人工智慧演算法的領先性和成熟性,形成具有巨大商業潛力的AI產品和解決方案。心無旁騖,專心突破,自然走得快,走得穩。目前,創新奇智已經打造出業界領先的人工智慧資料平臺和原創的深度學習支撐平臺,並發表了數篇頂級會議論文,但這些成果並不是炫技或者灌水的文章,而是實實在在提升了演算法在實際場景的精度,提升了訓練和推理的速度,並極為高效地整合了算力資源。
應用為王,商業落地
不僅僅人臉檢測演算法,從2018年成立以來,創新奇智的人工智慧視覺演算法已經在零售渠道陳列監控的商品識別、智慧貨櫃、工業視覺、智慧園區社群等領域取得行業領頭羊的地位。演算法領先,產品成熟,率先攻下陣地,佔領市場,為客戶提供了巨大的商業價值。
從最新的WIDER FACE排行榜來看,創新奇智已經具備優秀的人工智慧技術研發團隊,研發出了世界上最先進的人臉檢測演算法。相信創新奇智把最先進的人工智慧演算法應用到產業中,一定會創造更大的商業價值,助力企業客戶及合作伙伴提升商業效率和價值,為國家的人工智慧規劃實施添磚加瓦!