機器學習之開源庫大總結
機器學習之開源庫大總結
研究資料探勘和機器學習有一段時間了,對資料探勘來說,商用軟體有SAS、Clementine、Oracle資料探勘元件等等;由於個人學習和版權、演算法定製等問題,開源的資料探勘與機器學習軟體(庫)目前也十分必需,現在就跟大家介紹下比較流行和常用的機器學習開源庫。
以前在學校用過matlab,說實話真方便,通常一個模型只要幾十行甚至十幾行程式碼就能搞定,但是正版matlab較貴,而且不太適合商業開發使用,所以工業界使用它的並不多(通訊行業、研究所比較普遍);相應地,在工業界機器學習和資料探勘的實驗語言多為java、python,因為python與C\C++具有先天的血緣,所以python更容易擴充套件;java的機器學習庫也十分流行,主要體現在大資料下的jvm的本質和演算法並行化的優勢;現推薦給大家以下學習庫:
1.機器學習開源軟體網(收錄了各種機器學習的各種程式語言學術與商業的開源軟體)
http://mloss.org
2 偶爾找到的機器學習資源網:(也非常全,1和2基本收錄了所有ML的經典開源軟體了)
http://www.dmoz.org/Computers/Artificial_Intelligence/Machine_Learning/Software/
3 libsvm (支援向量機界最牛的,不用多說了,臺灣大學的林教授的傑作)
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
4 WEKA (基於java的機器學習演算法最全面最易用的開源軟體)
http://www.cs.waikato.ac.nz/ml/weka/
5 scikit (本人最喜歡的一個基於python的機器學習軟體,程式碼寫得非常好,而且官方的文件非常全,所有都有例子,演算法也齊全,開發也活躍
,強烈推薦給大家用)
https://pypi.python.org/pypi/scikit-learn/
6 OpenCv(最牛的開源計算機視覺庫了,前途無可限量,做影像處理與模式識別的一定要用,總不能整天抱著matlab做實驗和工業界脫節吧,但是有一定難度)
http://opencv.willowgarage.com/wiki/
7 Orange (基於c++和python介面的機器學習軟體,介面漂亮,呼叫方便,可以同時學習C++和python,還有視覺化的功能,)
http://orange.biolab.si/
8 Mallet (基於JAVA實現的機器學習庫,主要用於自然語言處理方面,特色是馬爾可夫模型和隨機域做得好,可和WEKA互補)
http://mallet.cs.umass.edu/
9 NLTK(PYTHON的自然處理開源庫,非常易用,也強大,還有幾本orelly的經典教程)
http://nltk.org/
10 lucene(基於java的包括nutch,solr,hadoop,mahout等全套,是做資訊檢索和搜尋引擎的同志們必學的開源軟體了,學JAVA的必學)
http://lucene.apache.org/
Additional:
1.pyml(a python module for machine learning,支援svm/knn/k-means==)
http://mlpy.sourceforge.net/
2.mahout(阿帕奇基金下專案,其主要是可以與hadoop進行天然結合,從而並行執行,在魯棒性方面很好)
http://mahout.apache.org/
3.milk(python的機器學習工具包,主要是針對監督學習,包括svm/knn/決策樹)
http://pypi.python.org/pypi/milk/
4.Octave(Andrew NG課上推薦使用的,類似matlab)
http://www.gnu.org/software/octave/
相關文章
- 機器學習、深度學習資源總結機器學習深度學習
- 【機器學習】--Python機器學習庫之Numpy機器學習Python
- 【收藏】機器學習開源框架大彙總,總有一款適合你機器學習框架
- 機器學習基礎總結機器學習
- 機器學習-步驟總結機器學習
- 機器學習基本概念總結機器學習
- 機器學習問題方法總結機器學習
- 開源機器學習系統(一)機器學習
- 機器學習實驗出錯總結機器學習
- python-機器學習程式碼總結Python機器學習
- 總結機器學習優質學習文章Top50!機器學習
- 機器學習數學知識積累總結機器學習
- 【機器學習】帶你3分鐘看完《機器學習實戰》總結篇機器學習
- Python Requets庫學習總結Python
- 腦洞大開!機器學習與AI突破(附連結)機器學習AI
- 經典機器學習演算法總結機器學習演算法
- LC-3 虛擬機器學習總結虛擬機機器學習
- 機器學習資源機器學習
- PHP 學習總結之字串PHP字串
- 機器學習之學習速率機器學習
- 深入學習之連結與總結
- 精心整理 | 林軒田機器學習資源彙總機器學習
- 《美團機器學習實踐》—— 讀後總結機器學習
- 開源相機管理庫Aravis學習(一)——安裝
- Python 客戶端類庫之paho-mqtt學習總結Python客戶端MQQT
- PHP 學習總結之函式PHP函式
- PHP 學習總結之陣列PHP陣列
- ❀ Spring5學習大總結Spring
- 機器學習之學習曲線機器學習
- 機器學習工具總覽機器學習
- 機器學習之pca機器學習PCA
- 機器學習之皮毛機器學習
- 機器學習和深度學習資源蒐集機器學習深度學習
- Android 常用開源庫總結(持續更新)Android
- .NET資料探勘與機器學習開源框架機器學習框架
- 10個必備的機器學習開源工具機器學習開源工具
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- 推薦 | 機器學習開源專案 Top 10機器學習