萬人角逐,院士指導,首屆全球人工智慧技術創新大賽花落誰家?

機器之心發表於2021-06-07
剛剛過去的幾個月,對於很多同學來說可能終身難忘。
 
他們剛參加了一場15000多人的PK,對手來自528所中國高校和136所海外高校,包括清華、北大、浙大、劍橋、牛津、密歇根、普渡、南洋理工等知名高校。這些選手組成了13923支隊伍,其中港澳臺及海外參賽隊伍比例超過 30%。
 
在這短短的幾個月裡,選手們經歷了上百次提交和無數個等待排行榜重新整理的時刻。最終,只有18支隊伍殺進了決賽。
 
6月4日,首屆全球人工智慧技術創新大賽決賽在杭州拉開帷幕。大賽由中國人工智慧學會和杭州市餘杭區人民政府籌備組聯合發起,得到了阿里雲OPPO等頭部科技企業的積極參與和支援。阿里雲天池平臺作為本次大賽的官方競賽平臺,為大賽提供平臺和算力支撐。


圖片

中國人工智慧學會副理事長、北京郵電大學副校長王文博為大賽致辭。
 
為了給全球參賽選手提供質量最高的同臺競技平臺,大賽請來了國務院參事、CAAI理事長、中國工程院院士戴瓊海,CAAI副理事長、中國工程院院士陳杰,CAAI副理事長、南京大學人工智慧學院院長周志華教授等為大賽提供最為專業的指導。
 
在6月5日開幕的2021全球人工智慧技術大會上,CAAI理事長戴瓊海院士、CAAI名譽理事長李德毅院士、浙江大學吳朝暉院士、阿里雲智慧副總裁劉湘雯女士等為獲獎選手頒發了獲獎證書。
 

圖片

現場頒獎圖。2021全球人工智慧技術大會由中國科學技術協會、中國科學院、中國工程院、浙江省人民政府指導,中國人工智慧學會、杭州市人民政府主辦,融入了「2021全球人工智慧技術創新大賽」和「2021全球人工智慧技術博覽會」,並同期舉行「第六屆全國高校人工智慧學院院長/系主任論壇」和「CAAI學術發展與學術期刊建設研討會」,旨在打造一個無縫連結的人工智慧全球力量。
 
從13923到18,這是一個「千軍萬馬過獨木橋」的過程。作為一個普通的吃瓜群眾,我們關心的是:這個比賽難不難?為什麼是這些團隊走到了最後?他們在參賽過程中總結出了哪些經驗?為了解答這些疑問,機器之心採訪了部分決賽選手,希望可以給未來參賽的同學提供一些借鑑。

圖片


這個比賽難不難?
 
在討論比賽的難點之前,我們先來看一下賽題。
 
本次大賽設定了醫學影像報告異常檢測、PANDA 大場景多物件檢測跟蹤、小布助手對話短文字語義匹配三個賽道,聚焦前沿科技與應用創新,推進人工智慧領域的學術交流、人才培養、技術發展以及跨界應用與融合。
 

圖片


眾所周知,醫療資料的標註是一個專業性要求極高的任務,很難透過傳統的眾包方式來解決。但是,影像科醫生在工作時會觀察醫學影像(如CT、核磁共振影像),並對其作出描述,這些描述中包含了大量醫學資訊,對解決上述問題具有重要意義。因此,賽道一要求參賽隊伍根據醫生對CT的影像描述文字脫敏資料,設計演算法來判斷身體若干目標區域是否有異常(初賽)以及異常的型別(複賽),以此來提高醫療資料的標註效率。
 
PANDA(gigaPixel-levelhumAN centric video Dataset)是清華大學團隊構建的國際上首個動態大場景多物件資料平臺,場景平均覆蓋平方千米級範圍,可同時觀測數千人,百米外人臉清晰可識別,影片解析度近10億畫素。
 

圖片


賽道二便是基於該資料平臺設計的。初賽任務是行人和車輛多目標檢測,即給定靜態PANDA影像,參賽選手需要檢測兩種型別的物件:行人和車輛。複賽的任務是行人多目標跟蹤,即給定PANDA影片序列,參賽選手需要提交影片中的行人軌跡。
 
小布助手是OPPO公司為歐加集團三品牌手機和loT裝置自研的語音助手,為使用者提供了有趣、貼心、便捷的對話式服務。意圖識別對話系統中的一個核心任務,而對話短文字語義匹配是意圖識別的主流演算法方案之一。賽道三要求參賽隊伍根據脫敏後的短文字query-pair,預測它們是否屬於同一語義。

圖片


根據選手的反饋,他們在這次比賽中要面對資料、賽題限制等多方面的挑戰。
 
首先來說資料。出於競賽公平性和資料安全性等方面的考慮,賽道一和賽道三的資料都經過了脫敏處理(如下圖),導致選手無法直接看到資料,或者說不能自己取樣並過一遍資料,從而難以發現資料的一些特點,也無法直接使用BERT等預訓練權重。為了解決這一難題,賽道一冠軍團隊選擇自己從頭預訓練BERT,還在預訓練階段結合了N-gram Mask和動態隨機Mask策略。

圖片


此外,賽道一的資料還存在標籤分佈不均衡、資料量少等問題。這就要求選手在拿到資料的第一時間就展開細緻的分析,而不是上來就套模型。對於資料量少的問題,賽道一冠軍團隊透過增強資料和增加任務等形式來解決。
 

圖片


賽道一冠軍團隊的解決方案。

 
賽道二資料的顯著特點包括圖片尺寸大、解析度高、目標多、目標尺度跨度大、遮擋嚴重、影片幀率低等。為了解決這些問題,賽道二的冠軍團隊在檢測任務中設計了一個金字塔多尺度預測的方案來解決檢測漏檢的問題,還提出了一個錨點切圖的資料預處理方案來解決樣本流失問題;在跟蹤任務中,他們提出了基於檢測框重識別和跟蹤軌跡預測條件的跟蹤流程,大大提高了跟蹤精度。
 

圖片

賽道二冠軍團隊解決方案。
 
看到這裡有人可能會問,這個比賽很耗算力吧,參賽選手都是人民幣玩家嗎?當然不是。其實,選手在複賽平臺賽階段用到的算力是由阿里雲天池提供的。對於算力不足的在校生來說,這一舉動確實幫助很大。賽道三的冠軍隊伍表示,「阿里雲提供的4 * V100,讓我有機會訓練15億引數的大模型,做了很多有意思的實驗」。此外,讓大家在相同的算力條件下比拼演算法,也是競賽公平性的有力保障。
 
當然,考慮到實際業務中對算力消耗、模型效率有要求,本次大賽對選手的模型訓練時間、推理時間都作了限制(如賽道三要求全流程訓練時間小於80小時,單條記錄預測時間小於18ms),這是選手所面臨的第二大難題。
 
賽道三的冠軍團隊表示,為了平衡速度和精度,他們最終選擇了犧牲單模型精度來換取更快的單模型速度,以此來訓練、融合更多模型,進而提升整個系統的分數。
 

圖片

賽道三冠軍團隊解決方案。
 
這一要求體現的是大賽對模型實用性的看重。天池平臺技術架構師盛樂樂曾表示,「過去幾年,我們有很多大賽並沒有把模型效率作為大賽指標,但是在答辯環節經常會有專家老師詢問選手模型的推理效率,並且很看重模型效率是否滿足實際應用場景的需要。因此,我們也逐漸把模型效率考核納入競賽指標,讓更多選手能在模型設計之初就將實用性考慮進來,從而推進優秀演算法的可落地性。競賽和實際應用不一樣:在競賽裡面,分數是模型好壞的唯一標準;但是實際應用需要關注模型的實用性,包括如何落地、模型效率、泛化能力等。」
 
有了這些限制之後,不少選手都將演算法的落地難度納入了考量,也收穫了評委的積極評價。

圖片

 
在某大廠實習的一位選手表示,這些要求其實和之前在公司做的專案很類似,因為公司的實際專案開發也需要考慮資源消耗、執行時長等問題,所以在比賽中遇到這一要求並沒有覺得差異很大。
 
正如賽道三的一位選手所言,這場比賽不僅考察了演算法能力,還考察了工程、實驗規劃、時間規劃等多方面的能力,總體來看是非常綜合的。
 

為什麼是這些團隊走到了最後?

 
從賽題的規定和選手的反饋可以看出,這次大賽是有一定難度的。但同時我們也看到,進入決賽的選手既有大廠的演算法工程師、國家重點實驗室研究員,也有初出茅廬的大學本科生,有些選手甚至是跨專業參賽。也就是說,除了知識和經驗,還有其他一些因素在選手的晉級之路上扮演了重要角色,比如溝通能力、創新能力等。
 
在談到參賽經驗時,不止一個團隊提到了「分享」、「交流」的重要性。據機器之心瞭解,為了促進參賽團隊之間的交流,大賽在每個賽道的初賽階段都設定了一個名為「週週星」的獎項,並安排獲獎團隊分享技巧心得,這對於參賽經驗不夠豐富的新手來說幫助很大,可以少走彎路。
 

「每週的前兩名週週星會進行方案分享,而我也會在比賽交流群裡請教各位前輩。對作為新手的我來說,他們都是我的指導老師。各位前輩參賽經驗豐富,分享的一些方案、技巧讓我獲益匪淺。如一位重慶郵電大學的學生所分享的『將Word2Vec和Glove預訓練的詞向量做拼接操作後,對Embedding層進行初始化』這一操作,讓我當時的線上成績從0.88提升到了0.90,這一方法不僅提高了我的成績,也讓我學到了更為新穎的技巧。」賽道一的季軍團隊在採訪中說道。

 

圖片

賽道二決賽結束後,選手在現場交(bài)流(shī)經(xué)驗(yì)。
 
令人驚喜的是,本次大賽還湧現了很多創新性的解決方案。很多排名靠前的團隊都使用了自己改造的方法,而不是簡單地照搬已有的方法。賽道二的評委老師在決賽總結中說道,「我們鼓勵一些創新性的方案出現,而不是簡單的工程堆積,這是很重要的一點」。
 

如果明年參賽,要做哪些準備?


每次比賽結束,我們都可以從選手身上挖掘出一些寶貴的賽後寄語,本次比賽也不例外。
 
在採訪中,幾乎每一個團隊都會強調「基礎知識」的重要性。賽道一的季軍團隊解釋說,「即便現在很多比賽都是深度學習『一把梭』,但是紮實的機器學習基礎能夠讓我們知道哪些該嘗試、哪些不該嘗試。比如在這次比賽中,大家中後期都開始嘗試模型融合,採用bagging的方式對結果加權平均。而為什麼採用bagging,為什麼在這個問題上使用加權平均的方式,這背後都是由經典機器學習的理論所支撐的。紮實的基礎在比賽的每個階段都很重要。」
 
但是,知識那麼多,要從哪兒開始學呢?主辦方給選手的建議是,「首先你需要選定一個方向,如 CV、NLP,然後找到對應的學習路徑。天池平臺其實也為剛入門的同學提供了一個類似知識樹的頁面。透過這個頁面,你可以看到每個方向最簡短的學習路徑,對這個領域有一個大致的瞭解。」
 

圖片


天池知識樹:https://tianchi.aliyun.com/course?spm=5176.14154004.J_3941670930.11.31fe5699cizNhw
 
除此之外,賽道一冠軍團隊還給大家寫了一份全方位的比賽攻略
 

圖片

 
該團隊的成員曾經拿過KDD Cup、中國資料分析馬拉松、阿里雲工業大資料挑戰賽等多個國內外大賽的冠亞軍,其中兩名隊員還是Kaggle Master,其經驗很有借鑑意義。
 

競賽之外,還有哪些問題值得關注?


競賽是推動創新的良好機制,與競賽同期舉辦的《AI青年說》則讓我們有機會靜下心來思考未來AI的發展趨勢。

圖片

 
在浙江大學求是特聘教授吳飛和阿里巴巴集團副總裁賈揚清看來,AI領域有以下幾大趨勢值得關注:

一是現有結果的工程化和規模化。賈揚清指出,AI領域從 0 到 1 的積累差不多已經完成,因此,「演算法的標準化、工程化,以及怎樣迅速地把標準演算法和特定的業務場景結合起來,是我們今天在計算機視覺、語音、自然語言理解等領域的大趨勢。」

二是各子領域之間的相互貫通。谷歌、OpenAI、DeepMind等推出的多模態、大規模模型讓我們看到,以前的計算機視覺、語音、自然語言處理等垂直場景已經開始融合,變得共通。未來,「我們需要有一個通用、多模態的模型,來統一理解各種形態的資料和各種形態的輸入。」在本次大賽中,我們也看到了這種趨勢。我們發現,很多選手其實是「跨界」參賽的,比如選擇CV賽道的同學自身的研究方向可能並非CV,這也反映了當前AI領域跨界融合的大趨勢。

三是從「大資料小任務」到「大資料大知識」。按照朱松純教授的說法,現在的機器智慧是『大資料小任務』,即使用上千GB的資料訓練一個模型完成有限的任務。兩位學者認為,我們需要打通的是大資料大知識,即怎樣從單點的目標或者單點的預測到更加完整的知識體系。如果這一問題得以解決,我們就可以進一步思考如何利用抽象出來的知識體系賦能其他領域。

在談到「AI內卷」的趨勢時,吳飛教授認為,「內卷是因為大家都跑到一條賽道上去了,比如都擠到大資料小任務的賽道,變成了所謂的調參俠。於是沒人做農業、司法、環境等更具開創性的場景應用,就發生了內卷。想象一下,你讀完人工智慧的博士或者研究生,如果進入一個稀缺人工智慧的行業,那麼你就是這個行業的 AI 之王,哪裡會有內卷。」

其實,吳飛教授也道出了本次大賽舉辦的初衷,即希望開拓大家的視野,展現AI落地的各種可能性,不要都湧向同一個賽道。

此外,我們還看到,大賽的三道賽題都來源於產業的真實需求,這符合當前產學研融合的大趨勢,是加快我國人工智慧人才培養的重要舉措。賽道一冠軍團隊告訴機器之心,他們的模型已經作為德睿智藥(MindRank AI)解決方案的一部分,在臨床藥物實驗資料探勘及藥物研發與真實世界資料研究業務中得到應用。
 
大規模數字化建設時代即將到來,屆時 AI 技術將融入現代社會各個方面的核心。在2021全球人工智慧技術大會上,戴瓊海院士表示:「當今世界,以人工智慧、大資料、雲端計算等為代表的前沿科技正在重塑人類生活,透過跨國別、跨文化、跨領域的交流與合作,不僅有利於我國新一代人工智慧的長足發展,而且對增進各方相互瞭解、凝聚各方原則共識,完善智慧時代的全球共建共治方略具有重要意義。」

相關文章