最受歡迎的語言仍然是R( KDnuggets 讀者中有61%使用者在用),python(39%),SQL(37%).SAS仍然穩定在20%之間。增長最快是:Pig/Hive/Hadoop為基礎的語言、R、SQL,同時perl, C/C++, 與Unix 在下降。同時我們發現,R與python使用者存在一定的重疊

之前的KDnuggets的調查主要是關注:統計與分析軟體,但有時候一個全面與強大的程式語言是需要的。這也是最近一次的KDnuggets調查關注的重點,我們諮詢:
在2013年中,什麼樣的程式或者統計語言你是在做分析、挖掘、科學計算的時候所需要的?
基於超過對700名會員的調查,最受歡迎的仍然是R語言(61%的調研會員在用),python(39%),SQL(37%),平均每個調研物件使用2.3種語言
趨勢對比過去二年的調查結果,發現2013的趨勢是一樣的:

  • 2012年調查:什麼樣的語言可用於資料分析與資料探勘。
  • 2011年調查:什麼樣的語言可用於資料分析與資料探勘。

· 增長率最高的語言,對比2013 vs 2012是Julia,使用人員增加超過2倍。但仍然是一門小眾語言,在2013年也僅有0,7%的使用者使用。
· 在比較普通的使用語言中:增加相對較大的語言,對比 2013 vs 2012:
· 以hadoop為基礎的語言:Pig Latin/Hive/other,19%的環比增長,從2012年的6.7%增加到2013。
· R,16%的環比增長。
· SQL,14%的增長(SQL的增長是的來源於Hadoop和其它的大資料系統中的SQL介面增長)。

語言的使用份額下降最大的是:

  • Lisp/Clojure, 77% 下降
  • Perl, 50%  下降
  • Ruby, 41%  下降
  • C/C++, 35%  下降
  • Unix shell/awk/sed, 25%  下降
  • Java, 22%  下降

R與PYTHON的使用者是否有重合呢?是的。在使用R語言的13%的使用者中,更可能使用python與總體相比要高出13%。下面是哪些語言更可能被R語言使用者使用(與總體相比)。

評論:

有一些評論說,比如:指出SPSS也是自己的語法和SAS一樣–在下次的調研中,我們將會包括進來。
樣本的區域分佈為:

  • US/Canada, 50.8%,
  • Europe: 25.7%,
  • Asia: 11.8%,
  • Latin America: 6.7%,
  • AU/NZ: 3.2%,
  • Africa/Middle East: 1.5%

注:本文來自中國統計網翻譯小組——@資料海洋 編譯

英文原文:

Top Languages for analytics, data mining, data science

自:中國統計網