十大Python機器學習常用庫python開發,你用過你個?

雁橫發表於2018-05-05

pgc-image/1525486878873220d9ab62e

請點選此處輸入圖片描述

1.Pipenv

Pipenv 是 Kenneth Reitz 的業餘專案,旨在將其他軟體包(例如 npm 和 yarn)整合到 Python 裡。它不需要安裝 virtualenv, virtualenvwrapper,不用管理 requirements.txt 檔案,並且不用確保依賴版本的可復現性。通過 Pipenv,你可以在 Pipfile 中指定依賴項。該工具可生成一個 Pipfile.lock 檔案,使你的構建更具確定性,避免產生難以查詢的 Bug。

2.PyTorch

PyTorch是Facebook深度學習框架,源於 Torch 框架,同時改善了 Torch 框架,基於ython 語言,由於實現了動態計算圖正規化, PyTorch 已經成為眾多研究人員的首選框架之一,可以計算梯度,而且非常快,可擴充套件性強。

3. Caffe2

Caffe2 支援分散式訓練、部署(即使是在移動平臺上),新的 CPU 和支援 CUDA 的硬體。PyTorch 可能更適合做研究,而 Caffe2 更加適合大規模部署,就像在 Facebook 上看到的那樣。另外,你可以在 PyTorch 裡構建並訓練模型,同時用 Caffe2 部署。

4. Pendulum

Pendulum 的優勢之一在於,它是 Python 標準 datetime 替代品,因此你可以輕鬆地將其與現有的程式碼整合,並且在你需要的時候才使用它的功能。Pendulum 的作者特別注意時間分割槽的處理,預設在每個例項中時間分割槽是可用的,並且以 UTC 計時。你也可以獲得擴充套件 timedelta 來簡化 datetime 的計算。

5. Dash

Dash 是一個可構建 Web 應用,尤其是資料視覺化 Web 應用的純 Python 開源庫。它建立在 Flask、Plotly 和 React 之上,並提供這幾個框架的函式抽象介面,從而開發者不必學習這些框架,高效開發。這些應用程式可在瀏覽器和移動裝置中使用。

6. PyFlux

PyFlux 是專門針對時間序列開發的 Python 開源庫。時間序列研究是統計學和經濟學的子領域,其目的是用於描述時間序列的行為,同時也預測時序未來的行為狀態。

7. Fire

Fire 是一個開源庫,可以為任何 Python 專案自動生成一個命令列介面。你幾乎不需要編寫任何程式碼或者文件,你只需要呼叫一個 Fire 方法並把它傳遞給你想要的命令列介面:一個函式、一個物件、一個類、一個庫,甚至不傳遞任何引數。

8. imbalanced-learn

imbalanced-learn 是一個 Python 庫,它提供了相關的技術來解決資料不平衡的問題。另外,它和 scikit-learn 相容,並且是 scikit-learn-contrib 專案的一部分,非常有用。

9. FlashText

FlashText 證明了演算法和資料結構設計的重要性,即使對於簡單的問題,更好的演算法也能夠輕鬆超越在快 CPU 上執行的樸素實現。

10. Luminoth

Luminoth 是一個用 TensorFlow 和 Sonnet 構建的開源的計算機視覺 Python 工具包。它可直接支援物體檢測,背後支援的模型是 Faster R-CNN。

以上是10個受歡迎的機器學習庫,你聽說或者學習了哪幾個呢?感興趣的可以深入瞭解一下。


相關文章