除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

机器之心發表於2019-04-16
除了大名鼎鼎的 kaggle,資料科學家可以參加的資料競賽平臺其實還蠻多的。有些比賽平臺不僅提供比賽,還讓你有機會自己創辦比賽。有些比賽由公司贊助,有些由政府機構贊助。參加這些比賽不僅能讓你的能力獲得認可,還可以獲得一些不菲的獎金呢~

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

在聽了上百節慕課(MOOC)、看了上千本書和筆記、聆聽了上百萬人對資料科學的看法後,你會做什麼呢?你要開始應用這些概念啦。應用機器學習概念的唯一方法就是親自動手。你可以在感興趣的領域選一些現實問題,也可以參加程式設計馬拉松(Hackathon)和機器學習競賽。

資料科學比賽不僅是演算法的應用。從本質上講演算法是一種工具,任何人都可以寫幾行程式碼來使用它。參加這些比賽的主要原因是它們能提供很好的學習機會。當然,競賽中的問題和現實問題不一定一樣,但這些平臺可以讓你將學到的知識付諸實踐,還能讓你瞭解自己和他人的差距。

參加資料科學比賽的好處

參加這些比賽可以說是有百利而無一害。它裡裡外外的好處有很多,比如:

  • 這是一個學習的好機會;

  • 可以接觸當前最佳的方法和資料集;

  • 可以和志同道合的人交往,團隊合作很棒的地方在於可以從不同角度思考問題;

  • 可以向世界展現你的才華,從而獲得更好的就職機會;

  • 參與並瞭解自己在排行榜上的表現也很好玩;

  • 還有獎品作為額外福利,但不應把它作為唯一的標準。

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

2009 年 9 月 18 日,BellKor Pragmatic Chaos 團隊在決賽中獲勝,正式贏得 NetFlix 的比賽。

Kaggle 是很有名的資料科學競賽平臺。這個線上社群有 10 萬多註冊使用者,這些使用者有新手也有專家。但除了 Kaggle,還有一些其它值得了解和研究的資料探勘競賽平臺。

Driven Data

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

Driven Data 舉辦資料科學競賽的目的是要建設更美好的世界,用最先進的預測模型來解決世界上最棘手的問題。Driven Data 在國際發展、醫療、教育、研究和保護以及公共服務等領域舉辦資料科學競賽,以謀求社會利益。你既可以參加平臺上的競賽,也可以透過該平臺舉辦自己的競賽。

該網站有專門的示例專案部分,這部分以案例研究的形式展示了一些成功的專案。Driven Data 列出的資料集都與一些非營利組織相關,資料從野生動物保護到公共衛生都有。因此,如果你想將自己的技能應用於實際問題,那這個平臺簡直就是為你而建的。

  • Driven Data:https://www.drivendata.org/

  • 參加比賽:https://www.drivendata.org/competitions/

  • 組織比賽:https://www.drivendata.org/partners/

  • 示例專案:http://drivendata.co/projects.html

CrowdANALYTIX

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

CrowdANALYTIX 是一個眾包分析平臺,該平臺將商業上的挑戰和問題轉換成競賽題目。CroudANALYTIX 社群透過合作與競爭的方式來構建和最佳化 AI、ML、NLP 和 深度學習演算法。該平臺還有社群部落格,其中有包括訪談和參考資料在內的大量資源。

  • CrowdANALYTIX:https://www.crowdanalytix.com/community

  • Community Blog:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html

Innocentive

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

InnoCentive 的重點在生命科學上,但也有其它有趣的競賽主題。參賽者可以參與解決一些世界上最緊迫的問題——從促進家用淨水供應到旨在吸引和殺死攜帶瘧疾的蚊子的被動式太陽能裝置。挑戰是真正的問題,它需要持續集中注意力、批判性思維、研究、創造力以及綜合性知識。開發出解決方案就是最大的獎勵,在這個過程中還可以進行無與倫比的腦力鍛鍊。

InnoCentive:https://www.innocentive.com/our-solvers/

TunedIT

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

TuneIT 最初是華沙大學(University of Warsaw)的一個理科博士專案,其目的是幫助資料探勘科學家進行可重複的實驗並輕鬆評估資料驅動演算法。後來出於教育、科研以及商業目的,補充了用於舉辦資料競賽的 TunedIT Challenges 平臺。

  • TunedIT:http://tunedit.org/

  • TunedIT Challenges:http://tunedit.org/challenges

Codalab

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

Codalab 是一個基於 web 端的開源平臺,平臺上的研究人員、開發人員以及資料科學家互相合作,以推進使用機器學習和高階計算的研究領域的發展。CodaLab 透過其線上社群解決資料導向研究領域的很多常見問題,人們可以在該社群共享 worksheets 並參與競賽。你既可以參加現有競賽,也可以舉辦新的競賽。

CodaLab:https://competitions.codalab.org/

Analytics Vidhya

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

Analytics Vidhya 除了為分析和資料科學專業人士提供了基於社群的知識門戶,還提供了大量資料科學的學習資源。該平臺還會舉辦程式設計馬拉松,透過競賽形式解決真實的行業問題。你既可以參加競賽,也可以贊助程式設計馬拉松。大多數在 Analytics Vidhya 上組織程式設計馬拉松的公司,都會給表現優異的參賽者提供很好的工作機會。

Analytics Vidhya:https://datahack.analyticsvidhya.com/?utm_source=main-logo

CrowdAI

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

資料科學挑戰平臺 crowdAI 每年都會舉辦很多開放的資料科學挑戰賽。這些比賽覆蓋了影像分類、文字識別、強化學習、對抗攻擊、影像分割、資源配置最佳化等多個領域。2017 年亞馬遜和英偉達贊助的競賽叫做「Learning to Run」,獎金高達 10 萬多美元。

  • crowdAI:https://www.crowdai.org/challenges

  • Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run

Numerai

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

Numerai 是由眾多資料科學家建立的、AI 運營的眾包對沖基金平臺。該平臺每週都會舉辦資料科學競賽以支援真正的對沖基金。Numerai 每週給參賽者提供加密資料,然後參賽者們提交其預測值。之後 Numerai 會根據所有提交結果構建元模型,並進行投資。

資料科學家們提交自己的預測值來換取一些 Numeraire,這是一種以太坊區塊鏈上的加密貨幣。

Numerai:https://numer.ai/rounds

天池

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

天池是阿里雲建立的資料競賽平臺,它和 Kaggle 很像。該社群中有成千上萬互相合作的資料科學家,他們還可以在該平臺中聯絡全球的企業和政府,以解決各行業中最棘手的問題。

天池:https://tianchi.aliyun.com/competition/gameList/activeList

DataScienceChallenge

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

Data Science Challenges 是由國防科學技術實驗室(Dstl)以及包括政府科學辦公室(Government Office for Science)、SIS 和 MI5 在內的許多英國政府部門共同贊助舉辦的,旨在鼓勵資料科學領域的優秀人才解決現實問題。該平臺提供的兩個挑戰賽現在已經結束了,但很快就會出現新的問題,這些比賽將鼓勵你找出現實問題的非正統答案。

Data Science Challenges:https://www.datasciencechallenge.org/

此外還有一些每年僅舉辦一次的比賽。

KDD CUP

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

KDD Cup 是 ACM 的資料探勘及知識發現專委會(SIGKDD)組織的資料探勘與知識發現競賽,該競賽一年舉辦一次,是資料探勘人才的頂級專業盛會。KDD-2019 將於 2019 年 8 月 4 日至 8 月 8 日在美國阿拉斯加州的安克雷奇舉行。

KDD-2019:https://www.kdd.org/kdd2019/kdd-cup

VizDoom AI competition(VDAIC)

除了Kaggle,這裡還有一些高質量的資料科學競賽平臺

ViZDoom 是基於 Doom 的 AI 研究平臺,透過原始視覺資訊進行強化學習。Visual Doom AI 競賽的參賽者要提交可以玩 Doom 的控制器(C++、Python 或 Java 均可)。

ViZDoom:https://www.crowdai.org/challenges/visual-doom-ai-competition-2018-singleplayer-track-1/leaderboards

結論

儘管這個名單會隨著時間推移而有所改變,但你最終會找到自己最感興趣的比賽。那麼,加油吧!

原文連結:https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c

相關文章