人工智慧和機器學習領域的10個開源專案

edithfang發表於2014-12-04
GraphLab
       
GraphLab是一種新的面向機器學習的並行框架。GraphLab提供了一個完整的平臺,讓機構可以使用可擴充套件的機器學習系統建立大資料以分析產品,該公司客戶包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它們從別的應用程式或者服務中抓取資料,通過推薦系統、欺詐監測系統、情感及社交網路分析系統等系統模式將大資料理念轉換為生產環境下可以使用的預測應用程式。

專案主頁: http://graphlab.org/
 
Vowpal Wabbit

Vowpal Wabbit(Fast Online Learning)最初是由雅虎研究院建設的一個機器學習平臺,目前該專案在微軟研究院。它是由John Langford啟動並主導的專案。

專案主頁:  http://hunch.net/~vw/
 
scikits.learn
       
scikit-learn是一個開源的、構建在SciPy之上用於機器學習的 Python 模組。它包括簡單而高效的工具,可用於資料探勘和資料分析,適合於任何人,可在各種情況下重複使用、構建在 NumPy、SciPy和 matplotlib 之上,遵循BSD 協議。

專案主頁: http://scikit-learn.org/stable
 
Theano
       
Theano是一個python庫,用來定義、優化和模擬數學表示式計算,用於高效的解決多維陣列的計算問題。它使得寫深度學習模型更加容易,同時也給出了一些關於在GPU上訓練它們的選項。

專案主頁: http://deeplearning.net/software/theano/
 
Mahout
       
Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源專案,提供一些可擴充套件的機器學習領域經典演算法的實現,旨在幫助開發人員更加方便快捷地建立智慧應用程式。Mahout包含許多實現,包括聚類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴充套件到雲中。

專案主頁: http://mahout.apache.org/
 
pybrain
      
pybrain是Python的一個機器學習模組,它的目標是為機器學習任務提供靈活、易應、強大的機器學習演算法。pybrain包括神經網路、強化學習(及二者結合)、無監督學習、進化演算法。以神經網路為核心,所有的訓練方法都以神經網路為一個例項。

專案主頁: http://pybrain.org/
 
OpenCV

OpenCV是一個基於(開源)發行的跨平臺計算機視覺庫,可以執行在Linux、Windows和Mac OS作業系統上。它輕量級而且高效——由一系列 C 函式和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的介面,實現了影像處理和計算機視覺方面的很多通用演算法。

專案主頁: http://opencv.org/
 
Orange

Orange 是一個基於元件的資料探勘和機器學習軟體套裝,它的功能即友好,又很強大,快速而又多功能的視覺化程式設計前端,以便瀏覽資料分析和視覺化,基繫結了 Python以進行指令碼開發。它包含了完整的一系列的元件以進行資料預處理,並提供了資料帳目,過渡,建模,模式評估和勘探的功能。

專案主頁: http://orange.biolab.si/
 
NLTK
       
NLTK(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發展非常活躍。它的主要作用是為了教學,至今已經在20多個國家60多所高校使用,裡面包括了大量的詞料庫,以及自然語言處理方面的演算法實現:分詞, 詞根計算, 分類, 語義分析等。

專案主頁: http://nltk.org/

Nupic


Nupic是一個開源的人工智慧平臺。該專案由Grok(原名 Numenta)公司開發,其中包括了公司的演算法和軟體架構。 NuPIC 的運作接近於人腦,“當模式變化的時候,它會忘掉舊模式,記憶新模式”。如人腦一樣,CLA 演算法能夠適應新的變化。

專案主頁: http://numenta.org/nupic.html
相關閱讀
評論(1)

相關文章