2017 年 GitHub 中最為流行的 30 個開源機器學習專案

李澤南發表於2018-01-06

原文網址 : http://www.jiqizhixin.com/articles/2018-01-06-5

2017 年裡哪些機器學習專案最受人關注？Mybridge 為我們整理了一份 Top 30 列表，以下所有專案均附有 GitHub 連結。

我們對比了近 8800 個開原機器學習專案，並挑選了其中最好的 30 個列舉於此。這是一個非常具有競爭力的列表，其中包含 2017 年 1 月-12 月份開源的各類優秀機器學習庫、資料集和應用。Mybridge AI 通過流行度、參與度和新鮮程度來對它們進行評級。先給你一個直觀印象：它們的 GitHub 平均 stars 是 3558 個。

開源專案對於資料科學家而言非常有意義，我們可以通過閱讀原始碼，在前人的基礎上構建更加強大的專案。現在，你可以盡情嘗試一下這些去年最佳專案了。

2017 年 GitHub 中最為流行的 30 個開源機器學習專案

No.1

FastText：快速文字表示/分類庫，來自 Facebook（GitHub 11,786 stars）

連結：https://github.com/facebookresearch/fastText

參考內容：Facebook釋出新版fastText：擴充至移動端，加入教程

又及 Muse：多語言無監督/監督詞嵌入，基於 FastText（GitHub 695 stars）

連結：https://github.com/facebookresearch/MUSE

No.2

Deep-photo-styletransfer：康奈爾大學 Fujun Luan 論文《Deep Photo Style Transfer》的程式碼與資料（GitHub 9747 stars）

連結：https://github.com/luanfujun/deep-photo-styletransfer

No.3

face recognition：最簡單的 Python 命令列面部識別 API，來自 Adam Geitgey（GitHub 8672 stars）

連結：https://github.com/ageitgey/face_recognition

參考內容：基於Python的開源人臉識別庫：離線識別率高達99.38%

No.4

Magenta：機器智慧音樂與藝術生成器（GitHub 8113 stars）

連結：https://github.com/tensorflow/magenta

參考內容：谷歌Magenta專案是如何教神經網路編寫音樂的？

No.5

Sonnet：基於 TensorFlow 的神經網路庫（GitHub 5731 stars），來自 DeepMind 成員 Malcolm Reynolds

連結：https://github.com/deepmind/sonnet

參考內容：DeepMind開源Sonnet：可在TensorFlow中快速構建神經網路

No.6

deeplearn.js：來自 Google Brain 團隊 Nikhil Thorat 的網頁端硬體加速機器學習庫（GitHub 5462 stars）

連結：https://github.com/PAIR-code/deeplearnjs

參考內容：谷歌開源DeepLearn.js：可在網頁上實現硬體加速的機器學習

No.7

Fast Style Transfer：TensorFlow 快速風格轉換，來自 MIT 的 Logan Engstrom（GitHub 4843 stars）

連結：https://github.com/lengstrom/fast-style-transfer

No.8

Pysc2：星際爭霸 2 學習環境，來自 DeepMind Timo Ewalds 等人（GitHub 3683 stars）

連結：https://github.com/deepmind/pysc2

No.9

AirSim：基於虛幻引擎的開源自動駕駛模擬器，由微軟研究院 Shital Shah 等人提出（GitHub 3861 stars）

連結：https://github.com/Microsoft/AirSim

No.10

Facets：機器學習資料集視覺化工具，來自 Google Brain（GitHub 3371 stars）

連結：https://github.com/PAIR-code/facets

參考內容：谷歌開源機器學習視覺化工具 Facets：從全新角度觀察資料

No.11

Style2Paints：AI 漫畫線稿上色工具，來自蘇州大學（GitHub 3310 stars）

連結：https://github.com/lllyasviel/style2paints

參考內容：Style2paints：專業的AI漫畫線稿自動上色工具

No.12

Tensor2Tensor：用於廣義序列-序列模型的工具庫，來自 Google Brain 的 Ryan Sepassi（GitHub 3087 stars）

連結：https://github.com/tensorflow/tensor2tensor

參考內容：一個模型庫學習所有：谷歌開源模組化深度學習系統Tensor2Tensor

No.13

CycleGAN and pix2pix in PyTorch：基於 PyTorch 的影像-影像轉換工具，來自 UC Berkeley 在讀博士朱儁彥（GitHub 2847 stars）

連結：https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

參考內容：你來手繪塗鴉，人工智慧生成「貓片」：edges2cats影像轉換詳解

No.14

Faiss：用密集向量高效相似性搜尋與聚類的工具庫，來自 Facebook（GitHub 2629 stars）

連結：https://github.com/facebookresearch/faiss

No.15

Fashion-mnist：一個類似於 MNIST 的時尚產品資料集，來自 Zalando Tech 的 Han Xiao（GitHub 2780 stars）

連結：https://github.com/zalandoresearch/fashion-mnist

No.16

ParlAI：用於在各種公開可用的對話資料集上訓練與評估 AI 模型的框架，來自 Facebook 的 Alexander Miller（GitHub 2578 stars）

連結：https://github.com/facebookresearch/ParlAI

參考內容：Facebook開源人工智慧框架ParlAI：可輕鬆訓練評估對話模型

No.17

Fairseq：來自 FAIR 的序列到序列工具包（GitHub 2571 stars）

連結：https://github.com/facebookresearch/fairseq

參考內容：Facebook提出全新CNN機器翻譯：準確度超越谷歌而且還快九倍（已開源）

No.18

Pyro：使用 Python 和 PyTorch 進行深度通用概率程式設計，來自 Uber AI Labs（GitHub 2387 stars）

連結：https://github.com/uber/pyro

參考內容：Uber與史丹佛大學開源深度概率程式語言Pyro：基於PyTorch

No.19

iGAN：基於 GAN 的互動影像生成器（GitHub 2369 stars）

連結：https://github.com/junyanz/iGAN

參考內容：伯克利大學和Adobe開源深度學習影像編輯工具 iGAN

No.20

Deep-image-prior：使用神經網路進行影像恢復，同時無需學習過程，來自 Skoltech 的 Dmitry Ulyanov（GitHub 2188 stars）

連結：https://github.com/DmitryUlyanov/deep-image-prior

No.21

Face classification：基於 Keras CNN 模型與 OpenCV 的實時面部檢測和表情/性別分類，訓練與 fer2013/imdb 資料集（GitHub 1967 stars）

連結：https://github.com/oarriaga/face_classification

No.22

Speech to Text WaveNet：使用 DeepMind 的 WaveNet 和 TensorFlow 構成的端到端句級英語語音識別，來自 Kakao Brain 的 Namju Kim（GitHub 1961 stars）

連結：https://github.com/buriburisuri/speech-to-text-wavenet

參考內容：DeepMind WaveNet，將機器合成語音水平與人類差距縮小50%

No.23

StarGAN：用於多領域影像-影像轉換的統一生成對抗網路（GitHub 1954 stars）

連結：https://github.com/yunjey/StarGAN

No.24

MI-agents：Unity 機器學習智慧體，來自 Unity3D 的 Arthur Juliani（GitHub 1658 stars）

連結：https://github.com/Unity-Technologies/ml-agents

No.25

Deep Video Analytics：分散式視覺化搜尋和視覺化資料分析平臺，來自康奈爾大學的 Akshay Bhat（GitHub 1494 stars）

連結：https://github.com/AKSHAYUBHAT/DeepVideoAnalytics

No.26

OpenNMT：Torch 上的開源神經機器翻譯（GitHub 1490 stars）

連結：https://github.com/OpenNMT/OpenNMT

參考內容：哈佛大學NLP組開源神經機器翻譯工具包OpenNMT：已達到生產可用水平

No.27

Pix2PixHD：使用條件 GAN 合成和處理 2048×1024 解析度的影像，來自英偉達 AI 科學家 Ming-Yu Liu（GitHub 1283 stars）

連結：https://github.com/NVIDIA/pix2pixHD

No.28

Horovod：分散式 TensorFlow 訓練框架，來自 Uber 工程團隊（GitHub 1188 stars）

連結：https://github.com/uber/horovod

參考內容：詳解Horovod：Uber開源的TensorFlow分散式深度學習框架

No.29

AI-Blocks：強大而直觀的 WYSIWYG 介面，可讓任何人建立機器學習模型（GitHub 899 stars）

連結：https://github.com/MrNothing/AI-Blocks

No.30

Voice Conversion with Non-Parallel Data：基於 TensorFlow 的深度神經網路語音轉換（語音風格轉換），來自 Kakao Brain 團隊的 Dabi Ahn（GitHub 845 stars）

連結：https://github.com/andabi/deep-voice-conversion

原文連結：https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

GitHub排名TOP30的機器學習開源專案
2019-05-11
Github機器學習
最適合練手30個的機器學習開源專案，趕緊收藏！
2018-05-09
機器學習
開源一個機器學習文字分析專案
2018-06-01
機器學習
Github 上 Star 最多的個人 Spring Boot 開源學習專案
2019-02-28
GithubSpring Boot
2018年10月Top 10機器學習開源專案
2018-11-09
機器學習
推薦 | 機器學習開源專案 Top 10
2019-02-21
機器學習
2019年20個最佳Python人工智慧和機器學習開源工具(專案)
2019-02-15
Python人工智慧機器學習開源工具
20 個值得學習的 Vue 開源專案
2021-10-19
Vue
2018年最實用的6個機器學習專案
2019-01-05
機器學習
機器人偽裝成人類在 GitHub 上為開源專案修復 bug
2019-02-28
機器人Github
2018年Github上值得學習的十個熱門專案
2018-05-09
Github
適合 Go 新手學習的開源專案——在 GitHub 學程式設計
2020-11-18
GoGithub程式設計
適合 JS 新手學習的開源專案——在 GitHub 學程式設計
2020-12-04
JSGithub程式設計
近期 github 機器學習熱門專案top5
2018-12-17
Github機器學習
Android專案中最火最常用的優秀開源專案
2018-05-11
Android
2018年最值得關注學習的25個JavaScript開源專案
2018-08-21
JavaScript
適合 C++ 新手學習的開源專案——在 GitHub 學程式設計
2020-11-05
C++Github程式設計
10個豐富自我的機器學習專案
2020-11-16
機器學習
10個必備的機器學習開源工具
2019-08-13
機器學習開源工具
如何高效的學習開源專案？
2018-10-13
GitHub實用開源專案
2022-12-23
Github
2018最值得關注的30個vue開源專案
2018-06-01
Vue
Halo 開源專案學習（七）：快取機制
2022-04-29
快取
一個優秀的Android開源框架學習專案ForgetSkyWanAndroid
2019-03-25
Android框架NaN
做機器學習專案的checklist
2020-01-21
機器學習
11 個 AI 和機器學習模型的開源框架
2018-08-13
AI機器學習模型框架
2020年度最佳的23個的機器學習專案（附原始碼）
2020-08-13
機器學習原始碼
機器學習專案是如何開發和部署的？
2020-05-28
機器學習
6月份最熱門的機器學習開源專案Top10
2018-07-03
機器學習
最適合練手的10大機器學習開源專案，趕緊收藏！
2018-05-08
機器學習
3 個好玩的前端開源專案「GitHub 熱點速覽」
2024-05-14
前端Github
5 個有趣的 Python 開源專案「GitHub 熱點速覽」
2024-08-20
PythonGithub
Halo 開源專案學習（一）：專案啟動
2022-04-22
機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)
2019-01-26
機器學習
Halo 開源專案學習（六）：事件監聽機制
2022-04-28
事件
Github 上那些開源專案的 star 數
2019-03-01
Github
GitHub 上優秀的 Go 開源專案
2019-12-25
GithubGo
GitHub上優秀的Go開源專案
2019-12-31
GithubGo
你不應該忽略的五個機器學習專案
2019-07-18
機器學習

2017 年 GitHub 中最為流行的 30 個開源機器學習專案

No.1

No.2

No.3

No.4

No.5

No.6

No.7

No.8

No.9

No.10

No.11

No.12

No.13

No.14

No.15

No.16

No.17

No.18

No.19

No.20

No.21

No.22

No.23

No.24

No.25

No.26

No.27

No.28

No.29

No.30

相關文章