單個AI模型生產只需1天 阿里浙大 “AI訓練師助手”成果被CVPR 2020接收

阿里安全官網發表於2020-04-10

文章來源:阿里安全官網


不久前,人力資源社會保障部發布了一種炙手可熱的新職業:AI訓練師。沒想到,浙江大學與阿里安全的人工智慧訓練師馬上創造出一個 “AI訓練師助手”,高效打造AI深度模型,應對海量應用場景的增加,讓AI訓練模型面對新場景時不用從頭學習,直接從已經存在的模型上遷移,迅速獲得別人的知識、能力,成為全新的AI模型,而且能將模型週期從一個月縮短為一天。隨後,闡述這種提升模型生產效率的論文被計算機視覺頂會CVPR 2020 接收(Oral)。


現在,影片、直播成為網際網路內容消費的重要載體,內容創作爆發,創作形式自由度高帶來了許多潛在安全威脅。好訊息是,AI深度模型被大規模用於多媒體內容的識別、檢測、理解上,用以狙擊含有不良內容的傳播。為了提升檢測的準確性,面向不同場景必須使用不同的AI模型。但是,由於媒體場景、細分領域多,如何才能高效生產不同AI 深度模型?


阿里安全圖靈實驗室高階演算法專家析策認為,與大資料相似,海量模型形成的模型倉庫也蘊含了巨大的潛在價值。這些預訓練的深度模型已消耗了大量訓練時間以及大規模高質量的標註資料等昂貴的計算資源。如果這些預訓練的模型能夠被合理使用,那麼針對新場景的模型訓練對時間以及資料的依賴就會顯著降低。


就像你要打造一輛能快速穿越雪地的車,不用從頭開始設計,可採用跑車的動力引擎設計,也可改裝坦克的履帶傳動。


目前實現這一目標最流行的方法是遷移學習。浙江大學和阿里安全發現,兩個預訓練深度模型所提取的特徵之間的遷移能力可由它們對應的深度歸因圖譜之間的相似性來衡量。相似程度越高,從不同的預訓練深度模型中獲得的特徵相關性就越大,特徵的相互遷移能力也就越強。而且,“AI訓練師助手”還知道從什麼模型遷移知識,用模型的哪個部分遷移能最好地完成任務。也就是說,他們發現了讓小白模型向AI深度模型學習的高效學習方法。


“在這種方法的指導下,單個AI模型的生產週期從1個月降到1天,我們就能更快地發現不同的內容風險。”析策希望,欺凌、色情、暴力、誤導等不良內容不會成為人們消費大量影像影片內容付出的代價,AI 技術可以更快地把不良內容擋在第一線。


論文地址:https://arxiv.org/abs/2003.07496

程式碼地址:https://github.com/zju-vipa/DEPARA


文章來源:阿里安全官網

相關文章