隨著程式語言的發展,有些語言有很好的發展,有些則面臨淘汰,而要數較熱門的,其中就有 Python。Python 作為一種通用指令碼語言,後來逐漸成為資料科學中最流行的語言。據 IT 行業的一些人說,Python 的成名是以 R 語言為踏腳石,R 現在是一門垂死的語言。
有一些證據表明,Python 的流行導致 R 的使用率越來越低。根據 TIOBE 統計, Python 目前是世界上第三大最受歡迎的語言,僅次於兩大熱門語言 Java 和 C,從 2018 年 8 月到 2019 年 8 月,Python 的使用率上升了 3% 以上,達到了 10% 的評級(TIOBE 主要衡量搜尋活動的專有標準),成為 20 種最受歡迎的語言中最顯眼的明星。
相比之下,近年來 R 在 TIOBE 排行榜上屢屢受挫,它從 2018 年 1 月的第 8 位下降到現在的第 20 位,僅次於 Perl、Swift 和 Go。在 2018 年 1 月的巔峰時期,R 的支援率約為 2.6%。但據 TIOBE 指數顯示,現在該指數已降至 0.8%。
TIOBE 的相關人士寫道:
Python的受歡迎程度持續增長,但它是以其他程式語言的流行程度下降為代價的,其中的一種程式語言是 R,而 Perl 下降得更快。
其他資料表明,Python 這些年來的成功是以犧牲 R 和 SAS(流行的專有分析環境)為代價的。據 Burtch Works 針對首選建模環境的調查顯示,Python、R 和 SAS 在 2018 年難分勝負:
Dice Insight 就曾經發表一篇關於“5 種註定要衰落的語言”,這其中就有 R。
R 被認為是面向統計計算的語言,儘管學術界和資料科學家仍然在使用 R,但一些資料分析公司正在轉向 Python,正如 Dice Insight 的高階編輯 Nick Kolakowski 所說:“依靠少數學者和其他人的使用不足以維持 R 的生存”。
對比 R 和 Python 的各種技術好處,可以發現的是,雖然使用者可能能夠在 R 或其庫中以本機完成任何統計任務,但在 Web 瀏覽器中工作時,該語言就比不上 Python,所以貶低 R 的人就在這方面上認為 R 的可伸縮性受到限制。Python 生態系統的增長超過了 R。
以上種種現象說明 Python 發展勢頭很猛,遠甩 R 很多條街。不過,有部分人卻確認為 R 語言並沒有正在衰落或已經衰落的跡象,DataCamp(美國一家資料分析線上教育平臺) 的創始人 Martijn Theuwissen 就表示:
關於 R 的下降的報導被大大誇大了,根據我的發現,如果你細細觀察 R,它還在增長,只是 Python 增長勢頭更快。
根據 R Consortium(為了推廣開放原始碼語言的使用而建立的組織) 的說法,目前全世界有 200 多萬 R 使用者,開發人員已經通過 CRAN(綜合 R 檔案網路) 編寫並開源了超過 13000 個庫,以自動化各種統計任務和繪製圖表。
R Consortium 說:
廣泛的組織已經採用 R 語言作為資料科學平臺,包括生物技術、金融、研究和高科技產業。R 語言通常整合到第三方分析、視覺化和報告應用程式中,並執行在各種各樣的計算平臺上。
R 的好處之一是它在大學院校裡是作為一門課程,許多研究生在其學科攻讀科學學位,學習 R 進行統計建模。隨著對資料科學家的需求不斷增長,“硬”科學方面受過訓練的這些人中許多將他們的統計能力運用於新的資料科學行業,隨之帶來了 R 知識。Python 也在高等教育中教授,但它更多的是在計算機專業。
總所周知,調查語言的受歡迎程度是一項艱鉅的工作,語言有自然的生命,沒有絕對的方法可以確定它們準確的生命週期,所以也沒有辦法完全預測它們的未來(即使是 TIOBE)。所以太過絕對地認為 Python 已經替代 R 是未免言之尚早。
在這個特定的時間,Python 的未來可能比 R 更光明,但這並不意味著 R 沒有未來。對於某些資料科學工作,Python 可能是最好的工具,但對於另一些人來說,Python 很難打敗 R。
自 開源中國