2017 年 GitHub 中最為流行的 30 個開源機器學習專案

李澤南發表於2018-01-06
2017 年裡哪些機器學習專案最受人關注?Mybridge 為我們整理了一份 Top 30 列表,以下所有專案均附有 GitHub 連結。

我們對比了近 8800 個開原機器學習專案,並挑選了其中最好的 30 個列舉於此。這是一個非常具有競爭力的列表,其中包含 2017 年 1 月-12 月份開源的各類優秀機器學習庫、資料集和應用。Mybridge AI 通過流行度、參與度和新鮮程度來對它們進行評級。先給你一個直觀印象:它們的 GitHub 平均 stars 是 3558 個。

開源專案對於資料科學家而言非常有意義,我們可以通過閱讀原始碼,在前人的基礎上構建更加強大的專案。現在,你可以盡情嘗試一下這些去年最佳專案了。

2017 年 GitHub 中最為流行的 30 個開源機器學習專案

No.1

FastText:快速文字表示/分類庫,來自 Facebook(GitHub 11,786 stars)

連結:https://github.com/facebookresearch/fastText

參考內容:Facebook釋出新版fastText:擴充至移動端,加入教程

又及 Muse:多語言無監督/監督詞嵌入,基於 FastText(GitHub 695 stars)

連結:https://github.com/facebookresearch/MUSE

No.2

Deep-photo-styletransfer:康奈爾大學 Fujun Luan 論文《Deep Photo Style Transfer》的程式碼與資料(GitHub 9747 stars)

連結:https://github.com/luanfujun/deep-photo-styletransfer

No.3

face recognition:最簡單的 Python 命令列面部識別 API,來自 Adam Geitgey(GitHub 8672 stars)

連結:https://github.com/ageitgey/face_recognition

參考內容:基於Python的開源人臉識別庫:離線識別率高達99.38%

No.4

Magenta:機器智慧音樂與藝術生成器(GitHub 8113 stars)

連結:https://github.com/tensorflow/magenta

參考內容:谷歌Magenta專案是如何教神經網路編寫音樂的?

No.5

Sonnet:基於 TensorFlow 的神經網路庫(GitHub 5731 stars),來自 DeepMind 成員 Malcolm Reynolds

連結:https://github.com/deepmind/sonnet

參考內容:DeepMind開源Sonnet:可在TensorFlow中快速構建神經網路

No.6

deeplearn.js:來自 Google Brain 團隊 Nikhil Thorat 的網頁端硬體加速機器學習庫(GitHub 5462 stars)

連結:https://github.com/PAIR-code/deeplearnjs

參考內容:谷歌開源DeepLearn.js:可在網頁上實現硬體加速的機器學習

No.7

Fast Style Transfer:TensorFlow 快速風格轉換,來自 MIT 的 Logan Engstrom(GitHub 4843 stars)

連結:https://github.com/lengstrom/fast-style-transfer

No.8

Pysc2:星際爭霸 2 學習環境,來自 DeepMind Timo Ewalds 等人(GitHub 3683 stars)

連結:https://github.com/deepmind/pysc2

No.9

AirSim:基於虛幻引擎的開源自動駕駛模擬器,由微軟研究院 Shital Shah 等人提出(GitHub 3861 stars)

連結:https://github.com/Microsoft/AirSim

No.10

Facets:機器學習資料集視覺化工具,來自 Google Brain(GitHub 3371 stars)

連結:https://github.com/PAIR-code/facets

參考內容:谷歌開源機器學習視覺化工具 Facets:從全新角度觀察資料

No.11

Style2Paints:AI 漫畫線稿上色工具,來自蘇州大學(GitHub 3310 stars)

連結:https://github.com/lllyasviel/style2paints

參考內容:Style2paints:專業的AI漫畫線稿自動上色工具

No.12

Tensor2Tensor:用於廣義序列-序列模型的工具庫,來自 Google Brain 的 Ryan Sepassi(GitHub 3087 stars)

連結:https://github.com/tensorflow/tensor2tensor

參考內容:一個模型庫學習所有:谷歌開源模組化深度學習系統Tensor2Tensor

No.13

CycleGAN and pix2pix in PyTorch:基於 PyTorch 的影像-影像轉換工具,來自 UC Berkeley 在讀博士朱儁彥(GitHub 2847 stars)

連結:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

參考內容:你來手繪塗鴉,人工智慧生成「貓片」:edges2cats影像轉換詳解

No.14

Faiss:用密集向量高效相似性搜尋與聚類的工具庫,來自 Facebook(GitHub 2629 stars)

連結:https://github.com/facebookresearch/faiss

No.15

Fashion-mnist:一個類似於 MNIST 的時尚產品資料集,來自 Zalando Tech 的 Han Xiao(GitHub 2780 stars)

連結:https://github.com/zalandoresearch/fashion-mnist

No.16

ParlAI:用於在各種公開可用的對話資料集上訓練與評估 AI 模型的框架,來自 Facebook 的 Alexander Miller(GitHub 2578 stars)

連結:https://github.com/facebookresearch/ParlAI

參考內容:Facebook開源人工智慧框架ParlAI:可輕鬆訓練評估對話模型

No.17

Fairseq:來自 FAIR 的序列到序列工具包(GitHub 2571 stars)

連結:https://github.com/facebookresearch/fairseq

參考內容:Facebook提出全新CNN機器翻譯:準確度超越谷歌而且還快九倍(已開源)

No.18

Pyro:使用 Python 和 PyTorch 進行深度通用概率程式設計,來自 Uber AI Labs(GitHub 2387 stars)

連結:https://github.com/uber/pyro

參考內容:Uber與史丹佛大學開源深度概率程式語言Pyro:基於PyTorch

No.19

iGAN:基於 GAN 的互動影像生成器(GitHub 2369 stars)

連結:https://github.com/junyanz/iGAN

參考內容:伯克利大學和Adobe開源深度學習影像編輯工具 iGAN

No.20

Deep-image-prior:使用神經網路進行影像恢復,同時無需學習過程,來自 Skoltech 的 Dmitry Ulyanov(GitHub 2188 stars)

連結:https://github.com/DmitryUlyanov/deep-image-prior

No.21

Face classification:基於 Keras CNN 模型與 OpenCV 的實時面部檢測和表情/性別分類,訓練與 fer2013/imdb 資料集(GitHub 1967 stars)

連結:https://github.com/oarriaga/face_classification

No.22

Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 構成的端到端句級英語語音識別,來自 Kakao Brain 的 Namju Kim(GitHub 1961 stars)

連結:https://github.com/buriburisuri/speech-to-text-wavenet

參考內容:DeepMind WaveNet,將機器合成語音水平與人類差距縮小50%

No.23

StarGAN:用於多領域影像-影像轉換的統一生成對抗網路(GitHub 1954 stars)

連結:https://github.com/yunjey/StarGAN

No.24

MI-agents:Unity 機器學習智慧體,來自 Unity3D 的 Arthur Juliani(GitHub 1658 stars)

連結:https://github.com/Unity-Technologies/ml-agents

No.25

Deep Video Analytics:分散式視覺化搜尋和視覺化資料分析平臺,來自康奈爾大學的 Akshay Bhat(GitHub 1494 stars)

連結:https://github.com/AKSHAYUBHAT/DeepVideoAnalytics

No.26

OpenNMT:Torch 上的開源神經機器翻譯(GitHub 1490 stars)

連結:https://github.com/OpenNMT/OpenNMT

參考內容:哈佛大學NLP組開源神經機器翻譯工具包OpenNMT:已達到生產可用水平

No.27

Pix2PixHD:使用條件 GAN 合成和處理 2048×1024 解析度的影像,來自英偉達 AI 科學家 Ming-Yu Liu(GitHub 1283 stars)

連結:https://github.com/NVIDIA/pix2pixHD

No.28

Horovod:分散式 TensorFlow 訓練框架,來自 Uber 工程團隊(GitHub 1188 stars)

連結:https://github.com/uber/horovod

參考內容:詳解Horovod:Uber開源的TensorFlow分散式深度學習框架

No.29

AI-Blocks:強大而直觀的 WYSIWYG 介面,可讓任何人建立機器學習模型(GitHub 899 stars)

連結:https://github.com/MrNothing/AI-Blocks

No.30

Voice Conversion with Non-Parallel Data:基於 TensorFlow 的深度神經網路語音轉換(語音風格轉換),來自 Kakao Brain 團隊的 Dabi Ahn(GitHub 845 stars)

連結:https://github.com/andabi/deep-voice-conversion 

原文連結:https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

相關文章