最受歡迎的語言仍然是R( KDnuggets 讀者中有61%使用者在用),python(39%),SQL(37%).SAS仍然穩定在20%之間。增長最快是:Pig/Hive/Hadoop為基礎的語言、R、SQL,同時perl, C/C++, 與Unix 在下降。同時我們發現,R與python使用者存在一定的重疊。
之前的KDnuggets的調查主要是關注:統計與分析軟體,但有時候一個全面與強大的程式語言是需要的。這也是最近一次的KDnuggets調查關注的重點,我們諮詢:
在2013年中,什麼樣的程式或者統計語言你是在做分析、挖掘、科學計算的時候所需要的?
基於超過對700名會員的調查,最受歡迎的仍然是R語言(61%的調研會員在用),python(39%),SQL(37%),平均每個調研物件使用2.3種語言。
趨勢對比過去二年的調查結果,發現2013的趨勢是一樣的:
- 2012年調查:什麼樣的語言可用於資料分析與資料探勘。
- 2011年調查:什麼樣的語言可用於資料分析與資料探勘。
· 增長率最高的語言,對比2013 vs 2012是Julia,使用人員增加超過2倍。但仍然是一門小眾語言,在2013年也僅有0,7%的使用者使用。
· 在比較普通的使用語言中:增加相對較大的語言,對比 2013 vs 2012:
· 以hadoop為基礎的語言:Pig Latin/Hive/other,19%的環比增長,從2012年的6.7%增加到2013。
· R,16%的環比增長。
· SQL,14%的增長(SQL的增長是的來源於Hadoop和其它的大資料系統中的SQL介面增長)。
語言的使用份額下降最大的是:
- Lisp/Clojure, 77% 下降
- Perl, 50% 下降
- Ruby, 41% 下降
- C/C++, 35% 下降
- Unix shell/awk/sed, 25% 下降
- Java, 22% 下降
R與PYTHON的使用者是否有重合呢?是的。在使用R語言的13%的使用者中,更可能使用python與總體相比要高出13%。下面是哪些語言更可能被R語言使用者使用(與總體相比)。
評論:
有一些評論說,比如:指出SPSS也是自己的語法和SAS一樣–在下次的調研中,我們將會包括進來。
樣本的區域分佈為:
- US/Canada, 50.8%,
- Europe: 25.7%,
- Asia: 11.8%,
- Latin America: 6.7%,
- AU/NZ: 3.2%,
- Africa/Middle East: 1.5%
注:本文來自中國統計網翻譯小組——@資料海洋 編譯
英文原文:
Top Languages for analytics, data mining, data science
自:中國統計網