更多優質內容請關注微信公眾號“AI 前線”(ID:ai-front)
Github 收藏平均數量:764⭐️
機器學習 Github Top10 開放原始碼,https://github.com/Mybridge/machine-learning-open-source。
主題:NLP 架構、視訊分類、Mlflow、經典遊戲、Dragonfire、Opencv、計算機視覺、Star GAN、Glow、生成壓縮
這些開源專案對程式設計師很有用,希望你能找到一個能引起你興趣的有趣專案。
英特爾人工智慧實驗室的 NLP 架構:探索最先進的 NLP 深度學習拓撲和技術的 Python 庫[Github 1194 顆星]
當前版本的 NLP Architect 包含了從研究角度和實際應用都非常有趣的特性:
NLP 核心模型可以為 NLP 工作流程提供強大的語言特徵提取功能:例如分析器(BIST)和 NP chunker
提供一流效能的 NLU 模組:例如意圖提取(IE),名稱實體識別(NER)
解決語義理解的模組:例如,內涵提取,最常見詞義,NP 嵌入表示(如 NP2V)
會話式 AI 元件:例如 ChatBot 應用程式,包括對話系統,序列分塊和 IE
使用新拓撲的端到端 DL 應用程式:例如 Q&A,機器閱讀理解
感謝 Intel Nervana[英特爾人工智慧實驗室對 NLP 架構的介紹:
https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/
github 連結:
https://github.com/NervanaSystems/nlp-architect
Video-nonlocal-net:用於視訊分類的非區域性神經網路,用 Caffe2 開發[Github 592 顆星]
Facebook Research 介紹:https://medium.com/@FBResearch
論文地址:https://arxiv.org/pdf/1711.07971.pdf
GitHub 連結:
https://github.com/facebookresearch/video-nonlocal-net
整個機器學習生命週期的開源平臺 [Github 1282 顆星]
目前的 MLflow 是 alpha 版本,意味著 API 和資料格式有可能發生變化,且不支援 Windows 執行。
GitHub 連結:
https://github.com/databricks/mlflow
經典遊戲強化學習平臺 [Github 905 顆星]
OpenAI 使用 Gym Retro 來研究強化學習(RL)演算法並研究泛化。 RL 之前的研究主要集中在優化代理解決單個任務上。 通過 Gym Retro,我們可以研究在概念相似但外觀不同的遊戲之間進行概括的能力。此外,OpenAI 還微信遊戲田姐了新的整合工具。
視訊地址:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/retro-heavy/output2.mp4
此版本包括世嘉創世紀和世嘉主系統的遊戲,以及任天堂的 NES,SNES 和 Game Boy 遊戲機。它還包括對世嘉 Game Gear,任天堂 Game Boy Color,任天堂 Game Boy Advance 和 NEC TurboGrafx 的初步支援。 一些已釋出的遊戲整合(包括 Gym Retro 的資料 / 實驗資料夾中的那些遊戲)處於測試狀態。由於涉及的變化規模很大,程式碼暫時只能在一部分遊戲上使用。
OpenAI 介紹:https://blog.openai.com/gym-retro/
GitHub 連結:
https://github.com/openai/retro/tree/develop
基於 Ubuntu 的 Linux 發行版的開源 AI 助手 [Github 688 顆星]
支援環境:
Dragonfire 執行命令步驟:
搜尋內建命令並評估代數表示式
嘗試學習使用高階 NLP 和資料庫管理技術
詢問無所不知的 Q&A 引擎(感謝所有為維基百科做貢獻的人)
使用 Deep Conversation 系統進行響應,這是一個使用 Cornell Movie-Dialogs Corpus 訓練的 seq2seq 神經網路
Dragonfire 使用 Mozilla DeepSpeech 來理解你的語音命令,並使用 Festival Speech Synthesis System 來處理文字到語音的任務。
你可以到 Gitter 聊天室(https://gitter.im/DragonComputer/Lobby),或者 Twitter 帳戶與 Dragonfire 體驗親自與她交談的樂趣。
DRAGON.COMPUTER 介紹:
https://github.com/DragonComputer/Dragonfire
GitHub 連結:
https://github.com/DragonComputer/Dragonfire
人臉、視訊、文字檢測和識別專案(使用自動翻譯器:中文 - >英文) [Github 1482 顆星]。
功能
人臉檢測、識別(圖片、視訊)
輪廓標識
頭像合成(給人戴帽子)
數字化妝(畫口紅、眉毛、眼睛等)
性別識別
表情識別(生氣、厭惡、恐懼、開心、難過、驚喜、平靜等七種情緒)
視訊物件提取
圖片修復(可用於水印去除)
圖片自動上色
眼動追蹤(待完善)
換臉(待完善)
開發環境
Windows 10(x64)
Python 3.6.4
OpenCV 3.4.1
Dlib 19.8.1
face_recognition 1.2.2
keras 2.1.6
tensorflow 1.8.0
Tesseract OCR 4.0.0-beta.1
GitHub 連結:
https://github.com/vipstone/faceai
嵌入式計算機視覺和機器學習庫(CPU 優化和 IoT 功能)[Github 557 顆星]
SOD 是嵌入式的現代跨平臺計算機視覺和機器學習軟體庫,公開了一套用於深入學習的高階媒體分析和處理 API,包括實時、多類別物件檢測和嵌入式系統上的模型訓練計算資源和物聯網裝置,旨在為計算機視覺應用提供通用基礎設施,並加速在開源和商業產品中使用機器感知。
SOD 目前的計算機視覺演算法支援但不限於移動機器人、AR/VR、基因學、人機互動、機器自動化等。
值得注意的 SOD 功能:
專為真實世界和實時應用程式而打造。
最先進的 CPU 優化深度神經網路,包括全新的獨家 RealNets 架構。
無需專利,先進的計算機視覺演算法。
支援主要的影象格式。
簡單,乾淨且易於使用的 API。
深入瞭解有限的計算資源,嵌入式系統和物聯網裝置。
易於使用 OpenCV 或任何其他專有 API 進行插補。
預訓練模型可用於大多數體系結構。
支援 CPU 的 RealNets 模型訓練。
已完備、跨平臺、高質量的原始碼。
SOD 是免費的,用 C 語言編寫,幾乎可以在所有平臺和體系結構上編譯和執行。合併 - 將所有 SOD 原始檔合併為一個 C 檔案(sod.c)以便於部署。
開源,積極開發和維護產品。
開發者友好的支援渠道(https://sod.pixlab.io/support.html)
SOD 程式設計指南:https://sod.pixlab.io/intro.html
Symisc Systems 主頁介紹:https://sod.pixlab.io/
GitHub 連結:https://github.com/symisc/sod
StarGAN 的簡單 Tensorflow 實現(CVPR 2018 Oral)[Github 382 顆星],感謝 Junho Kim。
StarGAN 是一個使用單個資料集解決多域影象到影象轉換問題的框架,可以合併包含不同標籤集的多個資料集,並靈活地使用這些標籤進行影象翻譯。
論文連結:https://arxiv.org/pdf/1711.09020.pdf
GitHub 連結:
https://github.com/taki0112/StarGAN-Tensorflow
神經網路硬體加速器編譯器 [Github 603 顆星],致謝 PyTorch。
Glow 是針對各種硬體目標而設計的機器學習編譯器和執行引擎,被用作高階機器學習框架的後端。該編譯器可以進行最先進的編譯器優化和神經網路圖的程式碼生成。這個庫還在實驗和發展階段。
工作原理
Glow 將傳統的神經網路資料流圖降低到兩階段強型別中間表示(IR)。高階 IR 允許優化器執行特定域的優化。較低階別的僅基於指令的 IR 允許編譯器執行與記憶體相關的優化,例如指令排程,靜態記憶體分配和複製消除。在最底層,優化器執行特定機器程式碼生成,以利用其硬體特性。Glow 的降低階段特點在於使編譯器無需在所有目標上實現所有運算子,從而支援大量的輸入運算子以及大量的硬體目標。降低階段的設計旨在減少輸入空間,讓新的硬體後端專注於少數線性代數基元。其設計理念在 arXiv 論文中有所描述。
論文連結:https://arxiv.org/abs/1805.00907
GitHub 連結:
https://github.com/pytorch/glow
Generative-compression:GAN 極端學習影象壓縮的 TensorFlow 實現。[Github 225 顆星],致謝 Justin-Tan。
Generative-compression 的方法由 Agustsson 等人在 Generative Adversarial Networks for Extreme Learned Image Compression 一文中提出。
論文連結:https://arxiv.org/pdf/1804.02958.pdf
GitHub 地址:
https://github.com/Justin-Tan/generative-compression
原文連結:
https://medium.mybridge.co/machine-learning-open-source-projects-of-the-month-v-june-2018-d87e2ca3e13f