2017 機器學習調查報告:Python 最火,R 極具潛力

發表於2017-11-07

資料平臺 Kaggle 近日釋出了 2017 機器學習及資料科學調查報告,這也是 Kaggle 首次進行全行業調查。調查共收到超過 16000 份回覆,受訪內容包括最受歡迎的程式語言、不同國家資料科學家的平均年齡、不同國家的平均年薪等。

點此查閱完整報告

下面主要看看工具使用方面的結果。請注意,該報告包含多個國家的資料,可能存在收集不夠全面的情況,僅供參考。

年齡

從全球範圍來看,本次調查物件的平均年齡在 30 歲左右。當然,各個國家的數值會有差異,中國的機器學習從業者年齡的中位數是 25 歲。

2017 機器學習調查報告:Python 最火,R 極具潛力

全球全職工作者為 65.7% ,其中中國為 53.% ,美國佔比較高,達 70.9% 。

2017 機器學習調查報告:Python 最火,R 極具潛力

Logistic 迴歸是除了軍事和國安領域外,最常用的資料科學研究方法。在軍事和國防安全領域,神經網路被使用更多。

2017 機器學習調查報告:Python 最火,R 極具潛力

在工具語言使用方面,Python是資料科學家使用最多的語言。同時,統計學家對 R 語言的忠誠度很高。

2017 機器學習調查報告:Python 最火,R 極具潛力

關係型資料是最常用的資料型別,學術研究者和國防安全領域則更親睞文字和影像。

2017 機器學習調查報告:Python 最火,R 極具潛力

Git 是他們最常用的程式碼共享和託管方式。

2017 機器學習調查報告:Python 最火,R 極具潛力

Dirty Data (髒資料)是從業者遇到的最大障礙。此外,理解不同演算法的能力不夠也是困擾資料工作者的一大障礙。缺乏有效管理和資金支援,是面臨的兩大外在困境。

2017 機器學習調查報告:Python 最火,R 極具潛力

有趣的是,只使用 Python 或只使用 R 的都覺得他們做出了正確的選擇。 但是,如果你去詢問那些既使用 Python 也使用 R 的人,推薦使用 Python 的可能會是 R 的兩倍。

2017 機器學習調查報告:Python 最火,R 極具潛力

資料科學是個變化極快的領域,業內人員需要不斷更新知識體系,才可以在業內保持一定地位,不被時代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已從業者經常使用的學習平臺。

2017 機器學習調查報告:Python 最火,R 極具潛力

更多內容可點此查閱完整報告

相關文章