Python正在取代R,成為資料科學界新寵
R:不是真正的語言
人們學習R很困難的一部分原因是,它並不是一種真正的程式語言。John Cook是一位R專家,他曾說:“R是一個做統計的互動環境,不是一種真正的程式語言。把R看做包含有程式語言的互動環境會更有幫助。”
但正如Bob Muenchen強調的,R甚至對於那些精通SAS和SPSS資料統計工具的人來說都是困難的。關於R為分析師降低了複雜性的問題,還有待爭議,雖然R包含巨集和矩陣語言,此外,你還需要掌握像SPSS等工具。但是對於那些期待R去實現類似Stata的功能的人,他們註定要失望。
綜合考慮,R的與眾不同使它較難學習。
Python降低資料科學技術壁壘
然而,Python更加平易近人。一方面,各種各樣的開發人員都熟悉Python並在廣泛的應用領域使用它。不像R幾乎只用於資料分析,一個開發人員在第一次編寫他的網站指令碼或其他應用程式時,就可以體驗到Python。
隨著企業竭盡所能地使用資料,他們也正在努力尋找合格的資料科學家。然而,正如Gartner的Svetlana Sicular所假設的,在本公司內對員工培訓一些簡單的大資料技術,比培訓新僱傭的資料科學家複雜的商業知識更有效率。
Python“所向披靡”
但是,除了可以利用現成的Python開發者資源,用Python語言做資料科學的最大好處之一是:在不同的應用程式中使用一種程式語言所增加的效率。德克薩斯大學奧斯汀分校研究助理Tal Yarkoni解釋說:“事實證明,使用一種語言來做所有的開發和分析的好處是相當可觀的。一方面,當你可以用同一種語言做所有的事情的時候,你就不必一直提醒自己:Ruby使用blocks而不是comprehensions,在Python中得到陣列的大小應當呼叫len(array),而不是array.length……
另外,你不需要再擔心專案的不同模組採用不同語言的介面問題。沒有什麼比在Python中解析一些文字資料,然後將它轉換成內部使用所需要的格式,最後才發現必須將它以另一種格式寫到磁碟上,以便R或者MATLAB去做分析更煩人的了。只要使用單一的語言,所有這些開銷都將消失。”
我們可以誇讚某個技術完美地解決了一個問題,但往往勝出的技術是解決一系列問題的通用工具。正如AppNexus優化和分析主管David Himrod指出:“AppNexus面臨的最大挑戰之一是如何讓不同的員工使用相同的技術來工作。Python為具有不同背景的員工(尤其是工程師,數學家和分析師)提供了一種常見的、容易理解的語言,可用於公司將新功能進行標準化。”
使用Python的主流資料科學
相比R豐富的資料分析能力,Python尚有很多不足,但是它正在迅速的縮小差距。請記住:Python成功的關鍵並不是它比R或其他分析工具能夠處理更神祕的功能,而在於它的平易近人和通用的性質。資料科學正在走出頭號怪胎的領域,上個月在紐約舉行的O'Reilly's Strata會議這一點尤為明顯:過去的與會者多是學術領域的博士,現在則是關鍵的業務分析師和其他被企業要求去弄清楚大資料業務的人。
相比R,這種新的,早期的“資料科學家”,將更多地使用Python。Python使用起來相對簡單,而且他們可能已經將其用於一個專案中了。至於在其他市場,相比於那些功能強大但複雜的工具,熟悉或者容易學習的工具更容易取勝。
來源:Python Displacing R As The Programming Language For Data Science
相關文章
- 【資料科學家】如何成為一名資料科學家?資料科學
- 如何成為資料科學家? - kdnuggets資料科學
- IT屌絲如何成為資料科學家?資料科學
- thenextweb:為什麼跨裝置資料將成為企業新寵?Web
- 業界 | 資料科學家“恐怖故事”資料科學
- 資料科學大Battle,你站Python還是R資料科學BATPython
- CPDA資料分析師:為什麼Python在資料科學方面超越R和SQL?Python資料科學SQL
- 為什麼Node.js正在成為企業軟體的寵兒?Node.js
- 成為資料科學家的入門專案資料科學
- 在資料科學方面,python和R有何區別?資料科學Python
- 資料科學領域,你該選 Python 還是 R ?資料科學Python
- Python資料科學(三) python與資料科學應用(Ⅲ)Python資料科學
- Python資料科學(二) python與資料科學應用(Ⅱ)Python資料科學
- Python資料科學(一) python與資料科學應用(Ⅰ)Python資料科學
- 如何有效的成為一名資料科學家資料科學
- kdnuggets:2017年Python打敗R成資料科學、機器學習中最熱門語言Python資料科學機器學習
- 資料科學家或將取代業務分析師? - Michael資料科學
- 深入對比資料科學工具箱:Python和R之爭資料科學Python
- Python或將成資料科學家首選語言Python資料科學
- 高薪高職排行榜前十:大資料行業成新寵高薪大資料行業
- Python資料科學(七) 資料清理(Ⅱ)Python資料科學
- Python資料科學(六) 資料清理(Ⅰ)Python資料科學
- [譯] 鮮為人知的資料科學 Python 庫資料科學Python
- 【R資料科學讀書筆記】R語言中的管道操作資料科學筆記R語言
- 為什麼Spark將成為資料科學家的統一平臺Spark資料科學
- 中控屏成智慧家居新寵?
- 如何輕鬆搞定資料科學麵試:Python&R語言篇資料科學PythonR語言
- 資料科學部門如何使用Python和R組合完成任務資料科學Python
- 雪晴網上海沙龍+線上直播:如何成為資料科學家?資料科學
- Python 資料科學之 PandasPython資料科學
- 【Python資料科學】之NumpyPython資料科學
- Python 資料科學入門Python資料科學
- 從全方位為你比較3種資料科學工具的比較:Python、R和SAS(附連結)資料科學Python
- Python資料科學(四) 資料收集系列Python資料科學
- 資料工程師、掌握資料分析,成為資料科學家、資料庫遷移專家工程師資料科學資料庫
- 資料科學家會被機器學習工程師取代嗎? - KDnuggets資料科學機器學習工程師
- 競技世界首席資料科學家巴川:資料科學,未來或將成為民族核心競爭力資料科學
- 在資料科學領域,Python語言和R語言有何區別?資料科學PythonR語言