2018 年最受歡迎的15個Python 庫,成都大資料分析培訓

weixin_34185560發表於2018-12-26

近日,資料科學網站 KDnuggets 評選出了頂級 Python 庫 Top15,領域橫跨資料科學、資料視覺化、深度學習和機器學習。

11097141-78a71c5cf690778b.jpeg

和往常一樣,我們需要你們的意見,如果你覺得專案沒有上榜單是不公平的,或者對我們的選擇有異議,請在評論求留言讓我們知道。

11097141-35d0f76a3c9463bf.jpeg

圖 1:根據 GitHub star 和貢獻評選出的 2018 頂級 Python 庫。形狀大小與貢獻者數量成正比。

以下為 2018 年排名前 15 的 Python 庫(資料截止 2018 年 12 月 16 日):

1 TensorFlow(貢獻者:1757,貢獻:25756,Stars:116765)

“TensorFlow 是一個使用資料流圖進行數值計算的開源軟體庫。圖形節點表示數學運算,而圖形邊緣表示在它們之間流動的多維資料陣列(張量)。這種靈活的體系結構使使用者可以將計算部署到桌面、伺服器或移動裝置中的一個或多個 CPU/GPU,而無需重寫程式碼。 ”

GitHub 地址:https://github.com/tensorflow/tensorflow

2 pandas(貢獻者:1360,貢獻:18441,Stars :17388)

“pandas 是一個 Python 包,、供快速,靈活和富有表現力的資料結構,旨在讓”關係“或”標記“資料使用既簡單又直觀。它的目標是成為用 Python 進行實際,真實資料分析的基礎高階構建塊。”

GitHub 地址:https://github.com/pandas-dev/pandas

3 scikit-learn(貢獻者:1218,貢獻者:23509,Stars :32326)

“scikit-learn 是一個基於 NumPy,SciPy 和 matplotlib 的機器學習 Python 模組。它為資料探勘和資料分析提供了簡單而有效的工具。SKLearn 所有人都可用,並可在各種環境中重複使用。

GitHub 地址:https://github.com/scikit-learn/scikit-learn

4 PyTorch(貢獻者:861,貢獻:15362,Stars:22763)

“PyTorch 是一個 Python 包,提供兩個高階功能:

具有強大的 GPU 加速度的張量計算(如 NumPy)

基於磁帶的自動程式設計系統構建的深度神經網路

你可以重複使用自己喜歡的 Python 軟體包,如 NumPy,SciPy 和 Cython,以便在需要時擴充套件 PyTorch。”

GitHub 地址:https://github.com/pytorch/pytorch

5 Matplotlib(貢獻者:778,貢獻:28094,Stars :8362)

“Matplotlib 是一個 Python 2D 繪相簿,可以生成各種可用於出版品質的硬拷貝格式和跨平臺互動式環境資料。Matplotlib 可用於 Python 指令碼,Python 和 IPython shell(例如 MATLAB 或 Mathematica),Web 應用程式伺服器和各種圖形使用者介面工具包。”

GitHub 地址:https://github.com/matplotlib/matplotlib

6 Keras(貢獻者:856,貢者:4936,Stars :36450)

“Keras 是一個高階神經網路 API,用 Python 編寫,能夠在 TensorFlow,CNTK 或 Theano 之上執行。它旨在實現快速實驗,能夠以最小的延遲把想法變成結果,這是進行研究的關鍵。”

GitHub 地址:https://github.com/keras-team/keras

7 NumPy(貢獻者:714,貢獻:19399,Stars:9010)

“NumPy 是使用 Python 進行科學計算所需的基礎包。它提供了強大的 N 維陣列物件,複雜的(廣播)功能,整合 C / C ++ 和 Fortran 程式碼的工具以及有用的線性代數,傅立葉變換和隨機數功能。

GitHub 地址:https://github.com/numpy/numpy

8 SciPy(貢獻者:676,貢獻:20180,Stars:5188)

“SciPy(發音為”Sigh Pie“)是數學、科學和工程方向的開源軟體,包含統計、優化、整合、線性代數、傅立葉變換、訊號和影像處理、ODE 求解器等模組。”

GitHub 地址:https://github.com/scipy/scipy

9 Apache MXNet(貢獻者:653,貢獻:9060,Stars:15812)

“Apache MXNet(孵化)是一個深度學習框架,旨在提高效率和靈活性,讓你可以混合符號和指令式程式設計,以最大限度地提高效率和生產力。 MXNet 的核心是一個動態依賴排程程式,可以動態地自動並行化符號和命令操作。”

GitHub 地址:https://github.com/apache/incubator-mxnet

10 Theano(貢獻者:333,貢獻:28060,Stars :8614)

“Theano 是一個 Python 庫,讓你可以有效地定義、優化和評估涉及多維陣列的數學表示式。它可以使用 GPU 並實現有效的符號區分。”

GitHub 地址:https://github.com/Theano/Theano

11 Bokeh(貢獻者:334,貢獻:17395,Stars :8649)

“Bokeh 是一個用於 Python 的互動式視覺化庫,可以在現代 Web 瀏覽器中實現美觀且有意義的資料視覺呈現。使用 Bokeh,你可以快速輕鬆地建立互動式圖表、儀表板和資料應用程式。”

GitHub 地址:https://github.com/bokeh/bokeh

12 XGBoost(貢獻者:335,貢獻:3557,Stars:14389)

“XGBoost 是一個優化的分散式梯度增強庫,旨在變得高效、強大、靈活和便攜。它在 Gradient Boosting 框架下實現機器學習演算法。XGBoost 提供了梯度提升決策樹(也稱為 GBDT,GBM),可以快速準確地解決許多資料科學問題,可以在主要的分散式環境(Hadoop,SGE,MPI)上執行相同的程式碼,並可以解決數十億個示例之外的問題。”

GitHub 地址:https://github.com/dmlc/xgboost

13 Gensim(貢獻者:301,貢獻:3687,Stars :8295)

“Gensim 是一個用於主題建模、文件索引和大型語料庫相似性檢索的 Python 庫,目標受眾是自然語言處理(NLP)和資訊檢索(IR)社群。”

GitHub 地址:https://github.com/RaRe-Technologies/gensim

14 Scrapy(貢獻者:297,貢獻:6808,Stars :30507)

“Scrapy 是一種快速的高階 Web 爬行和 Web 抓取框架,用於抓取網站並從其頁面中提取結構化資料。它可用於從資料探勘到監控和自動化測試的各種用途。”

GitHub 地址:https://github.com/scrapy/scrapy

15 Caffe(貢獻者:270,貢獻:4152,Stars :26531)

“Caffe 是一個以表達、速度和模組化為基礎的深度學習框架,由伯克利人工智慧研究(BAIR)/ 伯克利視覺與學習中心(BVLC)和社群貢獻者開發。”

成都加米穀大資料培訓機構,大資料開發,資料分析與挖掘,2019新年預報名學費特惠,詳情見加米穀大資料官網。

GitHub 地址:https://github.com/BVLC/caffe

參考連結:https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html

相關文章