6月份最熱門的機器學習開源專案Top10

AI前線發表於2018-07-03
6月份最熱門的機器學習開源專案Top10
編譯 | Debra
編輯 | Natalie
AI 前線導讀: 燥熱的 6 月天已經結束了,本月機器學習領域又有哪些開源專案值得一看呢?Mybridge AI 從將近 250 個機器學習開源專案中評選出排名 Top10 的專案。這是他們對在此期間新發布或進行重大發布的專案進行比較之後得出的結果,考量了各種因素對專案的專業性進行排序。哪些專案上榜了呢?

更多優質內容請關注微信公眾號“AI 前線”(ID:ai-front)


  • Github 收藏平均數量:764⭐️

  • 機器學習 Github Top10 開放原始碼,https://github.com/Mybridge/machine-learning-open-source。

  • 主題:NLP 架構、視訊分類、Mlflow、經典遊戲、Dragonfire、Opencv、計算機視覺、Star GAN、Glow、生成壓縮

這些開源專案對程式設計師很有用,希望你能找到一個能引起你興趣的有趣專案。

Top1 Nlp-architect

英特爾人工智慧實驗室的 NLP 架構:探索最先進的 NLP 深度學習拓撲和技術的 Python 庫[Github 1194 顆星]

6月份最熱門的機器學習開源專案Top10

當前版本的 NLP Architect 包含了從研究角度和實際應用都非常有趣的特性:

  • NLP 核心模型可以為 NLP 工作流程提供強大的語言特徵提取功能:例如分析器(BIST)和 NP chunker

  • 提供一流效能的 NLU 模組:例如意圖提取(IE),名稱實體識別(NER)

  • 解決語義理解的模組:例如,內涵提取,最常見詞義,NP 嵌入表示(如 NP2V)

  • 會話式 AI 元件:例如 ChatBot 應用程式,包括對話系統,序列分塊和 IE

  • 使用新拓撲的端到端 DL 應用程式:例如 Q&A,機器閱讀理解

6月份最熱門的機器學習開源專案Top10

感謝 Intel Nervana[英特爾人工智慧實驗室對 NLP 架構的介紹:

https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/

github 連結:

https://github.com/NervanaSystems/nlp-architect

Top2 視訊非區域網

Video-nonlocal-net:用於視訊分類的非區域性神經網路,用 Caffe2 開發[Github 592 顆星]

6月份最熱門的機器學習開源專案Top10

Facebook Research 介紹:https://medium.com/@FBResearch

論文地址:https://arxiv.org/pdf/1711.07971.pdf

GitHub 連結:

https://github.com/facebookresearch/video-nonlocal-net

Top3 Mlflow

整個機器學習生命週期的開源平臺 [Github 1282 顆星]

6月份最熱門的機器學習開源專案Top10

目前的 MLflow 是 alpha 版本,意味著 API 和資料格式有可能發生變化,且不支援 Windows 執行。

GitHub 連結:

https://github.com/databricks/mlflow

Top4 Gym Retro

經典遊戲強化學習平臺 [Github 905 顆星]

6月份最熱門的機器學習開源專案Top10

OpenAI 使用 Gym Retro 來研究強化學習(RL)演算法並研究泛化。 RL 之前的研究主要集中在優化代理解決單個任務上。 通過 Gym Retro,我們可以研究在概念相似但外觀不同的遊戲之間進行概括的能力。此外,OpenAI 還微信遊戲田姐了新的整合工具。

6月份最熱門的機器學習開源專案Top10

視訊地址:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4

此版本包括世嘉創世紀和世嘉主系統的遊戲,以及任天堂的 NES,SNES 和 Game Boy 遊戲機。它還包括對世嘉 Game Gear,任天堂 Game Boy Color,任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支援。 一些已釋出的遊戲整合(包括 Gym Retro 的資料 / 實驗資料夾中的那些遊戲)處於測試狀態。由於涉及的變化規模很大,程式碼暫時只能在一部分遊戲上使用。

OpenAI 介紹:https://blog.openai.com/gym-retro/

GitHub 連結:

https://github.com/openai/retro/tree/develop

Top5 Dragonfire v1.0

基於 Ubuntu 的 Linux 發行版的開源 AI 助手 [Github 688 顆星]

支援環境:

6月份最熱門的機器學習開源專案Top10

Dragonfire 執行命令步驟:

  • 搜尋內建命令並評估代數表示式

  • 嘗試學習使用高階 NLP 和資料庫管理技術

  • 詢問無所不知的 Q&A 引擎(感謝所有為維基百科做貢獻的人)

  • 使用 Deep Conversation 系統進行響應,這是一個使用 Cornell Movie-Dialogs Corpus 訓練的 seq2seq 神經網路

Dragonfire 使用 Mozilla DeepSpeech 來理解你的語音命令,並使用 Festival Speech Synthesis System 來處理文字到語音的任務。

你可以到 Gitter 聊天室(https://gitter.im/DragonComputer/Lobby),或者 Twitter 帳戶與 Dragonfire 體驗親自與她交談的樂趣。

DRAGON.COMPUTER 介紹:

https://github.com/DragonComputer/Dragonfire

GitHub 連結:

https://github.com/DragonComputer/Dragonfire

Top6 FaceAI

人臉、視訊、文字檢測和識別專案(使用自動翻譯器:中文 - >英文) [Github 1482 顆星]。

6月份最熱門的機器學習開源專案Top10

功能

  1. 人臉檢測、識別(圖片、視訊)

  2. 輪廓標識

  3. 頭像合成(給人戴帽子)

  4. 數字化妝(畫口紅、眉毛、眼睛等)

  5. 性別識別

  6. 表情識別(生氣、厭惡、恐懼、開心、難過、驚喜、平靜等七種情緒)

  7. 視訊物件提取

  8. 圖片修復(可用於水印去除)

  9. 圖片自動上色

  10. 眼動追蹤(待完善)

  11. 換臉(待完善)

開發環境

  • Windows 10(x64)

  • Python 3.6.4

  • OpenCV 3.4.1

  • Dlib 19.8.1

  • face_recognition 1.2.2

  • keras 2.1.6

  • tensorflow 1.8.0

  • Tesseract OCR 4.0.0-beta.1

GitHub 連結:

https://github.com/vipstone/faceai

Top7 Sod

嵌入式計算機視覺和機器學習庫(CPU 優化和 IoT 功能)[Github 557 顆星]

6月份最熱門的機器學習開源專案Top10

SOD 是嵌入式的現代跨平臺計算機視覺和機器學習軟體庫,公開了一套用於深入學習的高階媒體分析和處理 API,包括實時、多類別物件檢測和嵌入式系統上的模型訓練計算資源和物聯網裝置,旨在為計算機視覺應用提供通用基礎設施,並加速在開源和商業產品中使用機器感知。

SOD 目前的計算機視覺演算法支援但不限於移動機器人、AR/VR、基因學、人機互動、機器自動化等。

值得注意的 SOD 功能:

  • 專為真實世界和實時應用程式而打造。

  • 最先進的 CPU 優化深度神經網路,包括全新的獨家 RealNets 架構。

  • 無需專利,先進的計算機視覺演算法。

  • 支援主要的影象格式。

  • 簡單,乾淨且易於使用的 API。

  • 深入瞭解有限的計算資源,嵌入式系統和物聯網裝置。

  • 易於使用 OpenCV 或任何其他專有 API 進行插補。

  • 預訓練模型可用於大多數體系結構。

  • 支援 CPU 的 RealNets 模型訓練。

  • 已完備、跨平臺、高質量的原始碼。

  • SOD 是免費的,用 C 語言編寫,幾乎可以在所有平臺和體系結構上編譯和執行。合併 - 將所有 SOD 原始檔合併為一個 C 檔案(sod.c)以便於部署。

  • 開源,積極開發和維護產品。

  • 開發者友好的支援渠道(https://sod.pixlab.io/support.html)

SOD 程式設計指南:https://sod.pixlab.io/intro.html

Symisc Systems 主頁介紹:https://sod.pixlab.io/

GitHub 連結:https://github.com/symisc/sod

Top8 StarGAN-Tensorflow

StarGAN 的簡單 Tensorflow 實現(CVPR 2018 Oral)[Github 382 顆星],感謝 Junho Kim。

6月份最熱門的機器學習開源專案Top10

StarGAN 是一個使用單個資料集解決多域影象到影象轉換問題的框架,可以合併包含不同標籤集的多個資料集,並靈活地使用這些標籤進行影象翻譯。

論文連結:https://arxiv.org/pdf/1711.09020.pdf

GitHub 連結:

https://github.com/taki0112/StarGAN-Tensorflow

Top9 Glow

神經網路硬體加速器編譯器 [Github 603 顆星],致謝 PyTorch。

6月份最熱門的機器學習開源專案Top10

Glow 是針對各種硬體目標而設計的機器學習編譯器和執行引擎,被用作高階機器學習框架的後端。該編譯器可以進行最先進的編譯器優化和神經網路圖的程式碼生成。這個庫還在實驗和發展階段。

工作原理

Glow 將傳統的神經網路資料流圖降低到兩階段強型別中間表示(IR)。高階 IR 允許優化器執行特定域的優化。較低階別的僅基於指令的 IR 允許編譯器執行與記憶體相關的優化,例如指令排程,靜態記憶體分配和複製消除。在最底層,優化器執行特定機器程式碼生成,以利用其硬體特性。Glow 的降低階段特點在於使編譯器無需在所有目標上實現所有運算子,從而支援大量的輸入運算子以及大量的硬體目標。降低階段的設計旨在減少輸入空間,讓新的硬體後端專注於少數線性代數基元。其設計理念在 arXiv 論文中有所描述。

論文連結:https://arxiv.org/abs/1805.00907

GitHub 連結:

https://github.com/pytorch/glow

Top10 生成壓縮

Generative-compression:GAN 極端學習影象壓縮的 TensorFlow 實現。[Github 225 顆星],致謝 Justin-Tan。

6月份最熱門的機器學習開源專案Top10

Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。

論文連結:https://arxiv.org/pdf/1804.02958.pdf

GitHub 地址:

https://github.com/Justin-Tan/generative-compression

原文連結:

https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f  

相關文章