常見人工智慧比賽平臺總結

Zero-One-0101發表於2019-03-15

目錄


1.kaggle比賽

1.1 kaggle比賽是什麼?

Kaggle成立於2010年,是一個進行資料發掘和預測競賽的線上平臺。從公司的角度來講,可以提供一些資料,進而提出一個實際需要解決的問題;從參賽者的角度來講,他們將組隊參與專案,針對其中一個問題提出解決方案,最終由公司選出的最佳方案可以獲得5K-10K美金的獎金。除此之外,Kaggle官方每年還會舉辦一次大規模的競賽,獎金高達一百萬美金,吸引了廣大的資料科學愛好者參與其中。從某種角度來講,可以把它理解為一個眾包平臺,類似國內的豬八戒。但是不同於傳統的低層次勞動力需求,Kaggle一直致力於解決業界難題,因此也創造了一種全新的勞動力市場——不再以學歷和工作經驗作為唯一的人才評判標準,而是著眼於個人技能,為頂尖人才和公司之間搭建了一座橋樑


輸入https://www.kaggle.com/即可進入Kaggle主頁,網站有這麼幾個版塊:

  • 競賽competitions
  • 資料datasets
  • 程式碼kernels
  • 討論區 Discussion
  • 線上課程學習learn

1.2 為什麼舉辦kaggle比賽?

總結的原因如下:

  • 對於公司而言,kaggle可以認為是一個眾包的平臺,公司通過在上面提出要解決的問題,然後讓全世界各地優秀的資料科學家提出最優的解決方案。
  • 對於參賽者而言,是一個鍛鍊自己和證實自己能力的地方,同時如果拿到名次還有獎金等。
  • 創造了一種全新的勞動力市場——不再以學歷和工作經驗作為唯一的人才評判標準,而是著眼於個人技能,為頂尖人才和公司之間搭建了一座橋樑

1.3 kaggle比賽形式是什麼?

Kaggle上的競賽有各種分類,例如獎金極高競爭激烈的的 “Featured”,相對平民化的 “Research”等等。但整體的專案模式是一樣的,就是通過出題方給予的訓練集建立模型,再利用測試集算出結果用來評比。同時,每個進行中的競賽專案都會顯示剩餘時間、參與的隊伍數量以及獎金金額,並且會實時更新選手排位。在截止日期之前,所有隊伍都可以自由加入競賽,或者對已經提交的方案進行完善,因此排名也會不斷變動,不到最後一刻誰都不知道花落誰家。

由於這類問題並沒有標準答案,只有無限逼近最優解,所以這樣的模式可以激勵參與者提出更好的方案,甚至推動整個行業的發展。

kaggle競賽分類:

從參賽者的角度看,競賽種類有:推薦比賽Featured、人才徵募Recruitment、研究型Research、遊樂場Playground、入門比賽Getting Started、課業比賽In Class

kaggle競賽的排名機制:

在比賽結束之前,參賽者每天最多可以提交5次測試集的預測結果。每一次提交結果都會獲得最新的臨時排名成績,直至比賽結束獲得最終排名。在比賽過程中,Kaggle將參賽者每次提交的結果取出25%-33%,並依照準確率進行臨時排名。在比賽結束時,參賽者可以指定幾個已經提交的結果,Kaggle從中去除之前用於臨時排名的部分,用剩餘資料的準確率綜合得到最終排名。所以,比賽過程中用於最終排名的那部分資料,參賽者是始終得不到關於準確率的反饋的。這樣一定程度避免參賽模型的過擬合,保證評選出兼顧準確率和泛化能力的模型

1.4 kaggle比賽的獎勵制度是什麼?

Kaggle 比賽獎金豐厚,一般前三名均可以獲得獎金。在最近落幕的第二屆 National Data Science Bowl 中,總獎金池高達 100W 美刀,其中第一名可以獲得 50W 美刀的獎勵,即使是第十名也能收穫 2.5W 美刀的獎金。

獲獎的隊伍需要在比賽結束後 1~2 周內,準備好可執行的程式碼以及 README,演算法說明文件等提交給 Kaggle 來進行獲獎資格的稽核。Kaggle 會邀請獲獎隊伍在 Kaggle Blog 中發表 Interview,來分享比賽故事和經驗心得。對於某些比賽,Kaggle 或者主辦方會邀請獲獎隊伍進行電話/視訊會議,獲獎隊伍進行 Presentation,並與主辦方團隊進行交流。

總結

  • 對於公司提供的問題,公司會給出比較豐厚的獎金,給那些能夠提出最優的解決方案團隊。
  • 對於kaggle自己的比賽,kaggle公司建立豐厚的獎金,獎勵給獲獎的團隊。

2.阿里天池比賽

2.1 阿里天池比賽是什麼?

天池大資料競賽是由阿里巴巴集團主辦,面向全球科研工作者的高階演算法競賽通過開放海量資料和分散式計算資源,大賽讓所有參與者有機會運用其設計的演算法解決各類社會問題或業務問題。特別優秀的解決方案將有機會直接上線阿里巴巴旗下各電商網站(含淘寶、天貓等)或第三方合作伙伴平臺,服務中國乃至世界數以億計的使用者。

2014年3月,阿里巴巴集團董事局主席馬雲在北京大學發起“天池大資料競賽”。首屆大賽共有來自全球的7276支隊伍參賽,海外參賽隊伍超過148支。阿里巴巴集團為此開放了5.7億條經過嚴格脫敏處理的資料。2014年賽季的資料提供方為貴陽市政府,參賽者根據交通資料模擬控制紅綠燈時間,尋找減輕道路擁堵的方法。

2.2 為什麼舉辦阿里天池比賽?

應用意義:

大資料專家、阿里巴巴集團副總裁塗子沛介紹,比賽中勝出的優秀資料模型,不僅可用於參賽者的學術研究成果,還有機會走出實驗室,直接應用於淘寶、支付寶等真實的商業場景,影響中國乃至世界數以億計的使用者。在此前的“天貓推薦演算法大賽”中,6名90後大學生研發的個性化推薦演算法,在“雙11”當天的實戰效果超過天貓原有演算法的16.9%,贏得100萬元獎金。

塗子沛說,資料經濟的時代正在到來,中國2015年擁有的資料量佔全球的14%,到2020年這一比例將上升至21%。但我們的資料利用率不到0.4%,更多的資料仍然沉睡在各個角落。中國需要有效的資料處理方法,更需要大資料人才。阿里雲天池大賽將成為一個資料眾智眾創平臺,吸引更多政府、公司開放資料資源,創新資料商業模式,引爆新生代力量和資料經濟的能量.

2.3 阿里天池比賽的形式有哪些?

  • 阿里系統內的,如:天貓,淘寶等平臺提供資料和問題,主要的任務是CTR的預測
  • 第三方公司,如:美團,頭條等公司釋出的賽題
  • 比賽的方式都是由公司提供相關的資料,然後公佈到網上,同時釋出的還有資料的描述和問題的描述,參賽者通過報名參加可以下載到資料集,然後自己寫演算法,最後將預測結果進行提交。

2.4 阿里天池比賽的獎勵機制有哪些?

  • 根據團隊提交的結果,得出預測的精度,從而確定排名
  • 根據排名前後,對前三名的隊伍給予豐厚的現金獎勵
  • 對於表現優異的團體,可以直接拿到阿里等大公司的offer.

3.華為大資料比賽

3.1 華為大資料比賽是什麼?

華為大資料比賽是華為舉辦的一系列與大資料應用相關的比賽,每次比賽的內容不同,名字也不同,所以在這裡統一叫為華為的大資料比賽。華為的大資料比賽相比於其他平臺的大資料比賽,主題更加貼近人們的生活,其中不免有許多智慧硬體相關。

遵循“以用為先、以用為要”的原則,著力解決政府工作中的難點和人民群眾生活中的熱點問題,服務社會、服務民生,圍繞網際網路+及智慧企業、智慧醫療、智慧教育、智慧交通、智慧環保、智慧社群等領域,結合政府、企業和社會開放的資料,進行挖掘分析,重點是大資料應用實踐創新。

3.2 為什麼舉辦華為大資料比賽?

華為作為一家世界前500強企業,其產業規模之大,生態鏈非常完整。在整個公司運營中會產生大量的資料,這些資料是對於公司的運營非常有用的;同時,華為還致力於為其他公司提供軟體硬體上的智慧解決方案,也需要對資料進行分析。所以才有華為大資料比賽。

3.3 華為大資料比賽的形式有哪些?

  • 華為公司內部的資料和問題
  • 第三方公司的資料和問題
  • 針對全世界開放,資料脫密,線上提交

3.4 華為大資料比賽的獎勵機制有哪些?

  • 比賽的獎金
  • 公司的offer

4.其他

  • 中國無人駕駛賽車大賽
  • 中國大學生無人駕駛大賽
  • 中國大學生機器人設計大賽
  • VEX機器人大賽
  • FIRST 科技挑戰賽
  • ROBOFEST 大賽
  • 京東大資料比賽
  • 美團大資料比賽

相關文章