近日,兩年一度的世界計算機視覺領域頂會ECCV2020的各項挑戰賽結果出爐,在影像分類賽中,阿里安全的高效AI分類技術超越三星、深蘭科技、同濟大學等國內外多支隊伍的同類技術,獲得冠軍。
目前人工智慧的崛起以海量的帶標籤訓練資料作為基石,海量資料可以保障AI模型的效果,但是資料的收集和標註需要昂貴的人力成本,進行訓練則需要消耗大量計算資源。ECCV2020分類比賽的難題是,與其他比賽動輒使用十幾萬的資料不同,ECCV2020的分類比賽共有1000個類別,每個類別僅有50張圖片作為訓練資料。比賽要求選手在不使用任何預訓練模型和額外資料情況下,從零訓練模型。這意味著訓練難度巨大,幾乎是不可能完成的任務。
不過,這也正是ECCV2020為了考驗參賽隊伍如何對來之不易的訓練資料進行充分利用,促使AI神經網路進行高效學習,降低神經網路訓練過程中的人力和計算資源消耗,也就是說,參賽隊伍要打造一個高效能、低成本的分類AI。
阿里安全圖靈實驗室演算法工程師夜清介紹,阿里安全智慧演算法團隊從三個技術方向進行了突破:利用隨機抽取的兩張訓練影像,使用資料增強並進行拼接,最大程度豐富訓練樣本資源;設計獨特的神經網路結構,加入顯著性特徵模組挖掘樣本的特點,提升分類效能;利用分層語義結構,讓AI模型更好地挖掘資料,實現更好的學習效果。
阿里安全圖靈實驗室資深演算法專家華棠認為,高效AI分類技術極大程度上解決了計算資源消耗和資料標註的人力成本問題,為自動駕駛、物體識別、智慧城市等領域提供了新的思路和方法。
線上下新零售場景中,對於新上架的一件商品,原來AI工程師們需要從不同的角度、光照條件和位置拍攝、收集幾千甚至上萬張圖片並進行標註,用於訓練模型,才可以保證AI模型能充分學習到該商品的特徵。而在阿里安全提出的方案下,商品圖片數量縮減到50張以下,就能保證模型的識別能力。
“我們的方法還可以與自監督有效的結合,在學習更好的資料表徵基礎上,指導模型高效學習,獲得更好的識別能力。”夜清說。
目前,阿里安全這項基於小規模影像的高效AI技術已應用在智慧財產權商標識別、通用商品識別和動植物保護等場景中。這類場景類別數量多,每個類別樣本數量較少,而預訓練任務和目標任務存在差異,預訓練模型可能損害目標任務的準確率,這個方案恰恰能夠解決上述問題。
“以某知名品牌運動鞋上新為例,一段時間內我們僅能獲得該產品不同的配色以及商品幾個不同角度的圖片。在僅有少量商品展示圖的情況下,透過高效AI方案,我們在新產品問世的極短時間內實現新款商品識別能力的覆蓋,降低新產品被山寨和假冒的風險。”華棠說。
圖片說明:新產品上市後高效AI方案可快速對新產品進行智慧財產權保護
阿里安全圖靈實驗室資深演算法專家薛暉介紹,疫情期間,突發口罩佩戴問題使得大量人臉門禁失效,很多小區需要摘下口罩刷臉,帶來不必要的健康風險,高效AI分類技術的應用大大降低了模型初始化的資料需求量,幫助快速訓練好模型,解決了戴口罩的人臉識別問題。
今年3月,阿里率先提出新基建的新一代安全架構和安全基建,並開始打造數字基建安全樣板間。作為新一代安全架構安全技術層的核心AI技術,目前高效AI方案對內已賦能阿里多個業務場景,如淘寶影片、淘寶直播、優酷等平臺的智慧財產權保護,為數字基建的安全建設提供樣本參考,對外則透過綠網直接服務大中小企業。