3月份Github上最熱門的資料科學和機器學習專案TOP7

AI前線發表於2018-04-17

3月份Github上最熱門的資料科學和機器學習專案TOP7

策劃 & 編輯 | Natalie
譯者 | 安翔
編輯 | Emily
AI 前線導讀:在 GitHub 上,不僅可以學習不同領域的開發技術,還可以參與多個開源專案。幾乎所有的科技公司,乃至谷歌和 Facebook,都會在 GitHub 上傳他們的開源專案程式碼,很多的機器學習程式設計社群都從這些開源專案中獲益。

如果你平日太過繁忙,無暇在 GitHub 上去搜尋那些優秀的開源專案,那麼正好,本文將為你彙總出 3 月份最熱門的專案。你可以閱讀這些專案來更新你的知識庫,當然也可以將這些開原始碼借鑑到自己的專案中。

更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)

這份榜單包含了一些非常棒的程式碼庫。比如谷歌大腦的 AstroNet,又如人工智慧神經網路視覺化工具,我們彙總了多個強大的開源專案,相信它們能夠幫助你擴充套件自己在機器學習領域的視野。

準備好了嗎?讓我們一起來看看 3 月份的 Top7 開源專案吧!

更多閱讀:

一月份的 Top5 榜單 (https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018)

二月份的 Top5 榜單(https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/)可參見 AI 前線往期報導:2018 年 2 月份 Github 上最熱門的資料科學和機器學習專案

Person Blocker

3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/minimaxir/person-blocker

Person Blocker 是一個 Python 庫,它可以使用預先訓練好的神經網路自動遮蔽掉影象中所有的人。它的核心演算法採用 Mask R-CNN,並且在 MSCOCO 資料集上預先進行了訓練。你知道更棒的是什麼嗎?實際上,它甚至都不需要用到 GPU!

這套演算法能夠遮蔽遮擋的並不僅限於人,實際上它可以遮蔽 所有物件。它能夠識別 80 種不同型別的物體,包括車輛、小動物、電子產品,等等。

如果想要更多瞭解這個庫,你可以閱讀 Analytics Vidhya 的部落格(https://www.analyticsvidhya.com/blog/2018/04/person-blocker-is-a-python-script-that-blocks-out-people-from-images/)。

AstroNet 

3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/tensorflow/models/tree/master/research/astronet

AstroNet 是用來處理天文資料的深層神經網路模型。早在 2017 年 12 月,谷歌大腦團隊曾透露他們通過 AstroNet 發現了 2 顆新行星。這是一個巨大的發現,它展示了機器學習在當今世界的深遠影響力。

如今,谷歌大腦已經發布了該技術相關的全部程式碼,任何人都可以使用。該模型基於卷積神經網路(CNN)構建 。

更多閱讀:

AVBytes 上關於 AstroNet 的文章(https://www.analyticsvidhya.com/blog/2018/03/google-has-made-the-code-for-astronet-available-for-everyone/)。

ANN Visualizer

3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/Prodicode/ann-visualizer

ANN Visualizer 同樣是一個 Python 庫,它讓我們僅用一行程式碼即可實現人工智慧神經網路。它通常與 Keras 一起使用,並利用 Python 的'graphviz'庫來構建出一幅整潔炫酷的神經網路圖。

關於 ANN Visualizer,想要了解更多可以訪問:https://www.analyticsvidhya.com/blog/2018/04/python-library-visualizes-artificial-neural-networks/。

Fast Pandas

3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/mm-mansour/Fast-Pandas

即便是 Python 新手也能快速體會到 Pandas 這個庫的靈活性和強大的功能。作為一名資料科學家,你常常需要足夠的靈活性並且能夠針對不同問題想出應對之策。針對如此情形,Fast Pandas 正好可以提供多個實用方案。

這是一個非常有用的庫,強烈建議大家嘗試。

TensorFlow.js



3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/tensorflow/tfjs

使用 TensorFlow.js 這個開源庫,你可以通過 JavaScript 呼叫 API 的方法在 Web 瀏覽器中訓練和構建機器學習模型。如果你熟悉 Keras,那麼更上層的 API 對你來說完全不在話下。

它可用 GPU 加速,並自動支援 WebGL。你可以匯入預先訓練好的已有模型,也可以在瀏覽器中對這些機器學習模型重新進行訓練。

閱讀更多:

https://www.analyticsvidhya.com/blog/2018/04/tensorflow-js-build-machine-learning-models-javascript/。

Caffe64



3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/dfouhey/caffe64

Caffe64 是一個簡單小巧但功能非常強大的神經網路庫。眾所周知,神經網路庫的安裝大多都比較複雜。而 Caffe64 簡化了這一切,根據其開發人員的說法,Caffe64 是最容易編譯且最輕量級的神經網路庫。

使用 Caffe64,相信你能體會到它的美好!

TensorFlow Hub


3月份Github上最熱門的資料科學和機器學習專案TOP7

開源專案地址:https://github.com/tensorflow/hub

TensorFlow Hub 這個庫主要用於促進機器學習模型可重用部分的釋出、發現和使用。特別是它還提供了模組,這些模組是預先訓練好的 TensorFlow 模型,可以在新任務上重複使用。通過在相關任務上重新使用模組,你可以:


  • 用較小的資料集來訓練模型

  • 改進泛化

  • 大大加快訓練速度

你以前使用過這些開源專案嗎?有沒有自己的使用心得?如果有,歡迎評論分享!

閱讀原文

https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/


相關文章