2018 年最受歡迎的15個Python 庫，成都大資料分析培訓

weixin_34185560發表於2018-12-26

原文網址 : https://blog.csdn.net/weixin_34185560/article/details/87407462

Python大資料

近日，資料科學網站 KDnuggets 評選出了頂級 Python 庫 Top15，領域橫跨資料科學、資料視覺化、深度學習和機器學習。

和往常一樣，我們需要你們的意見，如果你覺得專案沒有上榜單是不公平的，或者對我們的選擇有異議，請在評論求留言讓我們知道。

圖 1：根據 GitHub star 和貢獻評選出的 2018 頂級 Python 庫。形狀大小與貢獻者數量成正比。

以下為 2018 年排名前 15 的 Python 庫(資料截止 2018 年 12 月 16 日)：

1 TensorFlow(貢獻者：1757，貢獻：25756，Stars：116765)

“TensorFlow 是一個使用資料流圖進行數值計算的開源軟體庫。圖形節點表示數學運算，而圖形邊緣表示在它們之間流動的多維資料陣列(張量)。這種靈活的體系結構使使用者可以將計算部署到桌面、伺服器或移動裝置中的一個或多個 CPU/GPU，而無需重寫程式碼。 ”

GitHub 地址：https://github.com/tensorflow/tensorflow

2 pandas(貢獻者：1360，貢獻：18441，Stars ：17388)

“pandas 是一個 Python 包，、供快速，靈活和富有表現力的資料結構，旨在讓”關係“或”標記“資料使用既簡單又直觀。它的目標是成為用 Python 進行實際，真實資料分析的基礎高階構建塊。”

GitHub 地址：https://github.com/pandas-dev/pandas

3 scikit-learn(貢獻者：1218，貢獻者：23509，Stars ：32326)

“scikit-learn 是一個基於 NumPy，SciPy 和 matplotlib 的機器學習 Python 模組。它為資料探勘和資料分析提供了簡單而有效的工具。SKLearn 所有人都可用，並可在各種環境中重複使用。

GitHub 地址：https://github.com/scikit-learn/scikit-learn

4 PyTorch(貢獻者：861，貢獻：15362，Stars：22763)

“PyTorch 是一個 Python 包，提供兩個高階功能：

具有強大的 GPU 加速度的張量計算(如 NumPy)

基於磁帶的自動程式設計系統構建的深度神經網路

你可以重複使用自己喜歡的 Python 軟體包，如 NumPy，SciPy 和 Cython，以便在需要時擴充套件 PyTorch。”

GitHub 地址：https://github.com/pytorch/pytorch

5 Matplotlib(貢獻者：778，貢獻：28094，Stars ：8362)

“Matplotlib 是一個 Python 2D 繪相簿，可以生成各種可用於出版品質的硬拷貝格式和跨平臺互動式環境資料。Matplotlib 可用於 Python 指令碼，Python 和 IPython shell(例如 MATLAB 或 Mathematica)，Web 應用程式伺服器和各種圖形使用者介面工具包。”

GitHub 地址：https://github.com/matplotlib/matplotlib

6 Keras(貢獻者：856，貢者：4936，Stars ：36450)

“Keras 是一個高階神經網路 API，用 Python 編寫，能夠在 TensorFlow，CNTK 或 Theano 之上執行。它旨在實現快速實驗，能夠以最小的延遲把想法變成結果，這是進行研究的關鍵。”

GitHub 地址：https://github.com/keras-team/keras

7 NumPy(貢獻者：714，貢獻：19399，Stars：9010)

“NumPy 是使用 Python 進行科學計算所需的基礎包。它提供了強大的 N 維陣列物件，複雜的(廣播)功能，整合 C / C ++ 和 Fortran 程式碼的工具以及有用的線性代數，傅立葉變換和隨機數功能。

GitHub 地址：https://github.com/numpy/numpy

8 SciPy(貢獻者：676，貢獻：20180，Stars：5188)

“SciPy(發音為”Sigh Pie“)是數學、科學和工程方向的開源軟體，包含統計、優化、整合、線性代數、傅立葉變換、訊號和影像處理、ODE 求解器等模組。”

GitHub 地址：https://github.com/scipy/scipy

9 Apache MXNet(貢獻者：653，貢獻：9060，Stars：15812)

“Apache MXNet(孵化)是一個深度學習框架，旨在提高效率和靈活性，讓你可以混合符號和指令式程式設計，以最大限度地提高效率和生產力。 MXNet 的核心是一個動態依賴排程程式，可以動態地自動並行化符號和命令操作。”

GitHub 地址：https://github.com/apache/incubator-mxnet

10 Theano(貢獻者：333，貢獻：28060，Stars ：8614)

“Theano 是一個 Python 庫，讓你可以有效地定義、優化和評估涉及多維陣列的數學表示式。它可以使用 GPU 並實現有效的符號區分。”

GitHub 地址：https://github.com/Theano/Theano

11 Bokeh(貢獻者：334，貢獻：17395，Stars ：8649)

“Bokeh 是一個用於 Python 的互動式視覺化庫，可以在現代 Web 瀏覽器中實現美觀且有意義的資料視覺呈現。使用 Bokeh，你可以快速輕鬆地建立互動式圖表、儀表板和資料應用程式。”

GitHub 地址：https://github.com/bokeh/bokeh

12 XGBoost(貢獻者：335，貢獻：3557，Stars：14389)

“XGBoost 是一個優化的分散式梯度增強庫，旨在變得高效、強大、靈活和便攜。它在 Gradient Boosting 框架下實現機器學習演算法。XGBoost 提供了梯度提升決策樹(也稱為 GBDT，GBM)，可以快速準確地解決許多資料科學問題，可以在主要的分散式環境(Hadoop，SGE，MPI)上執行相同的程式碼，並可以解決數十億個示例之外的問題。”

GitHub 地址：https://github.com/dmlc/xgboost

13 Gensim(貢獻者：301，貢獻：3687，Stars ：8295)

“Gensim 是一個用於主題建模、文件索引和大型語料庫相似性檢索的 Python 庫，目標受眾是自然語言處理(NLP)和資訊檢索(IR)社群。”

GitHub 地址：https://github.com/RaRe-Technologies/gensim

14 Scrapy(貢獻者：297，貢獻：6808，Stars ：30507)

“Scrapy 是一種快速的高階 Web 爬行和 Web 抓取框架，用於抓取網站並從其頁面中提取結構化資料。它可用於從資料探勘到監控和自動化測試的各種用途。”

GitHub 地址：https://github.com/scrapy/scrapy

15 Caffe(貢獻者：270，貢獻：4152，Stars ：26531)

“Caffe 是一個以表達、速度和模組化為基礎的深度學習框架，由伯克利人工智慧研究(BAIR)/ 伯克利視覺與學習中心(BVLC)和社群貢獻者開發。”

成都加米穀大資料培訓機構，大資料開發，資料分析與挖掘，2019新年預報名學費特惠，詳情見加米穀大資料官網。

GitHub 地址：https://github.com/BVLC/caffe

參考連結：https://www.kdnuggets.com/2018/12/top-python-libraries-2018.html

15個最受歡迎的Python開源框架
2021-02-26
Python框架
2018年Analytics Vidhya上最受歡迎的15篇資料科學和機器學習文章
2019-01-21
資料科學機器學習
2018年最受DevOps歡迎的五種工具！
2018-08-22
dev
2019年10個最受歡迎的JavaScript動畫庫！
2019-01-11
JavaScript動畫
2018年最受歡迎的三種程式語言：JavaScript、Java、Python
2018-09-14
JavaScriptPython
恆訊科技分析：哪些是跨境電商最受歡迎的資料庫？
2022-06-15
資料庫
2018最受歡迎電子書
2018-11-09
15 種最受歡迎的資料視覺化流程圖及模板
2022-03-11
視覺化流程圖
從GitHub中整理出來的15個最受歡迎的Python開源框架，你喜歡哪個
2018-05-09
GithubPython框架
2024 年最受歡迎的 5 個 Go 框架
2024-12-30
Go框架
DB-Engines：2019年全球最受歡迎資料庫 MySQL奪冠
2020-01-05
資料庫MySql
2018年Github最受歡迎機器學習語言Python穩坐冠軍，numpy、scipy是最受歡迎軟體包...
2019-01-25
Github機器學習Python
淘寶：2018年內衣消費“小資料” 75B最受歡迎
2018-06-25
Sensor Tower：2021年全球應用/遊戲資料分析 TikTok最受歡迎
2021-12-09
遊戲
回顧2018年最受歡迎的十四款NoSQL產品
2019-02-27
SQL
驢媽媽：2018年十大最受歡迎世界遺產景區
2018-06-09
2018 年最受歡迎的 VS Code 擴充套件外掛合集
2018-08-24
套件
推薦10個最受歡迎的 Vue.js UI 庫
2024-02-16
Vue.jsUI
資料分析之Python受歡迎的原因（二）
2019-01-21
Python
認證培訓 | 歡迎參加GBase 8a MPP Cluster資料庫5月訓練營
2022-05-07
資料庫
認證培訓 | 歡迎參加GBase 8a MPP CLuster資料庫3月訓練營
2022-03-15
資料庫
2007年-2020年最受歡迎的iPhone型號（附原資料表）
2020-08-13
iPhone
目前最受歡迎的12個Python web框架，你用過幾個？
2018-12-17
PythonWeb框架
2021年英國小吃最受歡迎比例（附原資料表）
2022-02-07
10款最受Python開發者歡迎的Python IDE
2021-09-09
PythonIDE
2024年最受歡迎的Vue.js元件庫 - ViewDesign全面解析
2024-03-13
Vue.js元件View
墨天輪最受DBA歡迎的資料庫技術文件-巡檢篇
2022-03-11
資料庫
墨天輪最受DBA歡迎的資料庫技術文件-監控篇
2022-04-18
資料庫
為什麼python大資料受歡迎?
2020-11-19
Python大資料
想成為高階程式設計師？最受歡迎的十大資料庫，全給你了！
2020-12-31
程式設計師大資料資料庫
墨天輪最受DBA歡迎的資料庫技術文件-SQL優化篇
2022-05-07
資料庫SQL優化
2019年YouTube十大最受歡迎遊戲內容
2019-12-26
遊戲
尼爾森：2018年假日季最受歡迎遊戲榜單
2018-11-10
遊戲
2018年曼谷成最受歡迎亞洲旅遊目的地城市
2019-11-10
TIOBE：2020年11月最受歡迎程式語言排行榜 Python超越Java成第二最受歡迎程式語言
2020-11-05
PythonJava
連續 3 年最受歡迎：Rust，香！
2020-07-22
Rust
2020年全球最受歡迎emoji表情排名
2020-07-19
【盤點】2018最受歡迎的網頁設計軟體集合！
2018-12-13
網頁

2018 年最受歡迎的15個Python 庫，成都大資料分析培訓

相關文章