總獎金 200 萬的 AI Challenger 開賽,可申請免費 GPU 資源

AI科技大本營發表於2017-09-05

總獎金 200 萬的 AI Challenger 開賽,可申請免費 GPU 資源

記者 | 周翔


8 月 14 日,創新工場、搜狗和今日頭條聯合宣佈共同發起“AI Challenger 全球 AI 挑戰賽”。其中,CSDN 作為選手社群,為大賽提供支援。(更多賽事資訊請檢視AI科技大本營之前的文章《獎金200萬,千萬資料規模,創新工場搜狗今日頭條聯合發起迄今國內最大AI挑戰賽》)

本屆 AI Challenger 大賽的主賽道競賽分別是:人體骨骼關鍵點檢測競賽、影象中文描述競賽、場景分類競賽、英中機器文字翻譯競賽、英中機器同聲傳譯競賽。

昨日( 9 月 4 日),首屆“AI Challenger 全球 AI 挑戰賽”於正式拉開帷幕,各路高手將展開為期三個月的比拼,並於 12 月中旬進行總決賽巔峰對決。獲獎團隊將分享合計超過 200 萬人民幣的獎金。

總獎金 200 萬的 AI Challenger 開賽,可申請免費 GPU 資源

除了獎金之外,參賽選手還有機會進入三家主辦方工作、實習或獲得投資,並有機會在國際頂級學術會議上分享獲獎心得,還將獲得包括上海科技大學教授馬毅、曠視科技首席科學家孫劍、前 Google 研究院高階管理科學家林德康等十餘位國內外人工智慧領域頂級專家評委的指導和評價。

另外,大賽主辦方表示,將努力為條件有限的參賽選手提供免費 GPU 資源的支援,幫助他們圓夢AI,選手可在各賽道相關資料集下載的頁面進行申請。

賽程安排

9月4日10:00,開放訓練資料集以及驗證資料集。

10月31日23:59:59,大賽報名截止。

12月3日23:59:59,各項競賽的排名將決定最終的成績排名。

12月中旬,大賽主賽道各項競賽的最終榜單排名前五的團隊將受邀到現場答辯並參加頒獎典禮。

大賽期間,主賽道及實驗賽道還將有雙週賽或單週賽並有獎金。

首個實驗賽道:虛擬股票趨勢預測

據AI科技大本營瞭解,AI Challenger 的首個實驗賽道,是虛擬股票趨勢預測,通過對大規模歷史資料建模,預測虛擬股票未來趨勢,這個實驗賽道適合有大資料背景、深度學習的初中級人士參與。

發起這個實驗賽道的創新工場表示,金融市場是由大資料驅動的行業,也是最快速被AI衝擊的行業之一。金融及相關資料可以說是目前最容易獲得、最海量公開、也是非常適合用於機器學習的資料來源。

作為 AI Challenger 第一屆大賽中相對低門檻的入門實驗賽道,金融AI應用對於科研來說有一定的指導意義。例如,雖然機器學習是目前金融趨勢預測、量化投顧的趨勢,但基於傳統運籌學、統計學思路的方法也有其發展空間,創新工場成立人工智慧工程院以來接觸到的很多高校中,均有針對這個領域開展研究的老師。接下來三個月,實驗賽道在賽題中將公開的脫敏資料,將有助於這些研究者判別科研成果的價值,這個實驗賽道便是將大眾熟悉的真實場景和前沿科研技術相結合的一個重點嘗試。

對股票價格趨勢的預測是金融領域極為複雜和極為關鍵的問題。有效市場假說認為股票價格趨勢不可能被預測,然而真實市場由於各種因素的存在並不完全有效,這對於股票市場而言相當於一種“錯誤”。AI Challenger的虛擬股票趨勢預測實驗賽道,為參賽者提供了大規模的股票歷史資料,從而可以通過集合大家的智慧來糾正股票市場的這些“錯誤”。

本競賽資料來源主要以股票及新聞資料為主。競賽每週一輪。選手通過訓練模型,對虛擬股票走勢進行預測。每輪結束時統計該輪隊伍排名。最終累計每週積分決出最終的大獎。冠軍將獲得5萬元人民幣的獎勵。同時,每週都會對該輪排名前三的隊伍頒發獎金。該實驗賽道由創新工場單獨發起、管理和運營,獎勵由創新工場提供。

參賽選手

創新工場方面表示,自 8 月 14 日開放報名以來,AI Challenger 平臺已經匯聚了來自世界各地的參賽者。

來自高校的包括中國清華大學、北京大學、中科院、上海交通大學、復旦大學、中科大、香港科技大學、香港中文大學、臺灣大學,美國康奈爾大學、佐治亞理工、紐約大學、英國劍橋大學、帝國理工學院,德國卡爾斯魯厄大學,法國國立路橋學校,澳洲臥龍崗大學以及日本早稻田大學。

來自公司機構的包括百度、螞蟻金服、小米、搜狐、奇虎360、眾安保險、平安科技、同花順、陌陌、迅雷、中興通訊、中國移動、中國電信、格靈深瞳、馭勢科技、摩拜,微軟、通用電氣、英特爾、eBay、Micron、法國巴黎銀行,還有神祕的公安部院所。

參賽者中也不乏曾經在各種大賽上叱吒風雲的牛人,比如天池阿里移動推薦演算法大賽冠軍、滴滴DI-tech演算法大賽冠軍、ImageNet 目標分類任務和定位任務雙料冠軍、中興演算法精英挑戰賽冠軍,IBM-滴滴程式設計馬拉松大賽冠軍,以及 Kaggle 大賽的眾多優勝者。

開放資料集

本次大賽提供了百萬量級的計算機視覺資料集、千萬量級的機器翻譯資料集,包括:超過1000萬條中英文翻譯資料、70萬個人體骨骼關鍵點標註資料、30萬張圖片場景標註和語義描述資料。這是國內迄今公開的規模最大的科研資料集,已經在大賽官網(challenger.ai)上線,供參賽選手下載,進行演算法設計、模型訓練及評估。

1. 人體骨骼關鍵點資料集此資料集是目前規模最大,場景、人物動作及身體遮擋情況最複雜的資料集。它使用含有人物的圖片,對人體14個骨骼關鍵點分別作出標註,共有30萬張圖片,包含了超過100種複雜生活場景內的實際人物動作與姿態,標註人物個數達到70萬量級,遠超過MSCOCO的10萬人、以及MPII的4萬人量級。該資料集將挑戰現有主流演算法的魯棒性。

基於此資料集的研究成果可以被直接應用於動作分類和識別,動作捕捉,影象和視訊內容理解,人機互動,自動駕駛(行人動作和意圖識別),安防(異常行為檢測),無人零售(消費者行為理解)等領域。

2. 影象中文描述資料集:此資料集是目前規模最大、場景和語言使用最豐富的圖片中文描述資料集,共有30萬張圖片,150萬句中文描述,使用了超過100種複雜生活場景的含有人物的圖片,而且此資料集的語言描述標註更符合中文語言使用習慣。相對於MSCOCO和Flickr8k-CN,在完整描述圖片主體事件的基礎之上,該資料集創新性的引入了形容詞和中文成語,用以修飾圖片中的主要人物及背景事件,大大提升了描述語句的豐富度。本資料集的標註量遠大於Flickr8k-CN(8000張圖),巨大的資料量和複雜的圖片場景將直接挑戰現有演算法的可用性。

基於此資料集的研究成果可以被直接應用於影象與視訊語義理解、影象與視訊自動標註、影象與視訊內容檢索、人工智慧輔助教育、機器人視覺、盲人輔助等人工智慧相關領域。

3. 英中翻譯資料集:此資料集的訓練資料量達到1000萬句對,每一條資料由一句英文和對照的中文構成,是最大規模的口語領域英中比賽資料集。訓練資料全部經過譯員檢查和矯正,句正確率在97%以上,英中雙語句對對照工整、質量高、噪音低。

基於此資料集的研究成果可以被直接應用於機器翻譯,尤其是口語機器翻譯、同聲傳譯應用。




相關文章