對於機器學習者來說,閱讀開原始碼並基於程式碼構建自己的專案,是一個非常有效的學習方法。看看以下這些Github上平均star為3558的開源專案,你錯了哪些?
1. FastText:快速文字表示和文字分類庫(Github上有11786顆星,貢獻者Facebook Research)
原始碼連結:https://github.com/facebookresearch/MUSE
2. Deep-photo-styletransfer:“Deep Photo Style Transfer” 這篇論文的原始碼和資料。(GitHub 9747顆星,論文來自於康奈爾大學的Fujun Luan)
原始碼連結:https://github.com/luanfujun/deep-photo-styletransfer
3. 用Python和命令列來實現的最簡單的面部識別API(GitHub 8672顆星,貢獻者Adam Geitgey)
原始碼連結:https://github.com/ageitgey/face_recognition
4. Magenta:利用機器智慧生成音樂和美術藝術品(GitHub 8113顆星)
原始碼連結:https://github.com/tensorflow/magenta
5. Sonnet:基於TensorFlow的神經網路庫(GitHub 573顆星,貢獻者是DeepMind的Malcolm Reynolds )
原始碼連結:https://github.com/deepmind/sonnet
6. deeplearn.js: 一個用於Web的硬體加速機器學習庫(GitHub 5462顆星,貢獻者是Google Brain的Nikhil Thorat)
原始碼連結:https://github.com/PAIR-code/deeplearnjs
7. 基於TensorFlow的快速風格遷移庫(GitHub 4843顆星,貢獻者是MIT的Logan Engstrom)
原始碼連結:https://github.com/lengstrom/fast-style-transfer
8. Pysc2: 星際爭霸2學習環境(GitHub 3684顆星,貢獻者是DeepMind的Timo Ewalds)
原始碼連結:https://github.com/deepmind/pysc2
9. AirSim: Microsoft AI & Research開源的基於虛幻引擎的開源模擬器,用於自動駕駛(GitHub 3861顆星,貢獻者是Microsoft的Shital Shah)
原始碼連結:https://github.com/Microsoft/AirSim
10. acets: 機器學習資料集的視覺化工具(GitHub 3371顆星,由Google Brain貢獻)
原始碼連結:https://github.com/PAIR-code/facets
11. Style2Paints:用AI技術為線稿快速上色的工具(GitHub 3310顆星)
原始碼連結:https://github.com/lllyasviel/style2paints
12. Tensor2Tensor:一個用於廣義序列-序列模型的庫 - Google Research(GitHub 3087顆星,貢獻者是Google Brain的Ryan Sepassi)
原始碼連結:https://github.com/tensorflow/tensor2tensor
13. 基於Pytorch實現的圖片-圖片轉換(GitHub 2847顆星,貢獻者Berkeley的Jun-Yan Zhu, Ph.D)
原始碼地址:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix
14. Faiss:用於密集向量的高效相似性搜尋庫和聚類的庫(GitHub 2629顆星,貢獻者Facebook Research)
原始碼地址:https://github.com/facebookresearch/faiss
15. Fashion-minist:類似於MNIST的時尚產品資料集(GitHub 2780顆星,貢獻者是Zalando Tech的Han Xiao)
原始碼連結:https://github.com/zalandoresearch/fashion-mnist
16. ParlAI: 一個可用在各種公開可用的對話資料集上訓練和評估AI模型的框架(GitHub 2578顆星,貢獻者是Facebook 的Alexander Miller)
原始碼連結:https://github.com/facebookresearch/ParlAI
17. Fairseq:Facebook AI Research的序列-序列工具包(GitHub 2571顆星)
原始碼連結:https://github.com/facebookresearch/fairseq
18. Pyro:基於Python和PyTorch的深度通用概率程式設計(GitHub 2387顆星,貢獻者Uber Engineering)
原始碼連結:https://github.com/uber/pyro
19. iGAN:基於GAN的互動式影像生成(GitHub 2369顆星)
原始碼地址:https://github.com/junyanz/iGAN
20. Deep-image-prior:用神經網路恢復影像(GitHub 2188顆星,貢獻者是Skoltech的Dmitry Ulyanov, Ph.D)
原始碼地址:https://github.com/DmitryUlyanov/deep-image-prior
21. 人臉分類:基於 Keras CNN 模型與 OpenCV ,使用fer2013/imdb 資料集進行實時面部檢測和表情/性別分類(GitHub 1967顆星)
原始碼地址:https://github.com/oarriaga/face_classification
22. Speech-to-Text-WaveNet:使用DeepMind的WaveNet和TensorFlow進行端到端句級英語語音識別(GitHub 1961顆星,貢獻者是Kakao Brain的Namju Kim)
原始碼地址:https://github.com/buriburisuri/speech-to-text-wavenet
23. StarGAN: 用於多域影像-影像轉化的統一生成對抗網路(GitHub 1954顆星,貢獻者Korea University的Yunjey Choi)
原始碼地址:https://github.com/yunjey/StarGAN
24. MI-agents:Unity機器學習代理(GitHub 1658顆星,貢獻者Unity3D的Arthur Juliani)
原始碼地址:https://github.com/Unity-Technologies/ml-agents
25. DeepVideoAnalytics:一個分散式視覺化搜尋和資料分析平臺(GitHub 1494顆星,貢獻者是Cornell University 的Akshay Bhat)
原始碼地址:https://github.com/AKSHAYUBHAT/DeepVideoAnalytics
26. OpenNMT:Torch上的開源神經機器翻譯工具包(GitHub 1490顆星)
原始碼地址:https://github.com/OpenNMT/OpenNMT
27. Pix2pixHD: 用條件GAN合成和處理2048×1024的影像(GitHub 1283顆星,貢獻者是英偉達科學家 Ming-Yu Liu)
原始碼地址:https://github.com/NVIDIA/pix2pixHD
28. Horovod:TensorFlow 布式 訓練框架(GitHub 1188 顆星,貢獻者來自Uber )
原始碼地址:https://github.com/uber/horovod
29. AI-Blocks: 一個強大而直觀的所見即所得介面,可讓任何人建立機器學習模型(GitHub 899顆星)
原始碼地址:https://github.com/MrNothing/AI-Blocks
30. Tensorflow實現的用於語音風格轉換的深度神經網路(GitHub 845顆星,貢獻者是Kakao Brain AI團隊的Dabi Ahn)
原始碼地址:https://github.com/andabi/deep-voice-conversion
原文連結:https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7