你知道嗎?常用的資料探勘分析工具Mahout和MLlib
傳統的資料探勘軟體
專用挖掘工具、通用挖掘工具
–QUEST
–MineSet
–DBMiner
–Intelligent Miner
–SAS Enterprise Miner
–SPSS Modeler
大資料探勘工具Mahout
Mahout 是Apache Software Foundation (ASF) 開發的一個開源專案
–目標是建立一些可伸縮的資料探勘演算法,供開發人員在Apache 在許可下免費使用。
–Mahout 包含許多實現,包括叢集、分類、CF 和進化程式。
–此外,通過使用Apache Hadoop庫,Mahout 可以有效地擴充套件到雲中。
Mahout的意思是大象的飼養者及驅趕者。
–Mahout 這個名稱來源於Hadoop徽標上的大象
–Mahout利用Hadoop來實現可伸縮性和容錯性。
Mahout與Hadoop家族其他主要成員關係
大資料探勘工具MLlib
MLlib是構建在Spark上的分散式資料探勘工具,利用Spark的記憶體計算,和適合迭代型計算的優勢,使效能大幅度提升。
•同時Spark運算元豐富的表現力,讓大規模資料探勘的演算法開發不再複雜
•MLlib作為Spark其中一部分,目前已經完全包含入Spark中。
資料探勘框架(Spark MLlib)
•MLlib是Spark對常用的資料探勘演算法的實現庫,同時包括相關的測試和資料生成器:
•MLlib目前支援多種常見的資料探勘問題:
–二元分類、迴歸、聚類以及協同過濾,同時也包括一個底層的梯度下降優化基礎演算法。
專用挖掘工具、通用挖掘工具
–QUEST
–MineSet
–DBMiner
–Intelligent Miner
–SAS Enterprise Miner
–SPSS Modeler
大資料探勘工具Mahout
Mahout 是Apache Software Foundation (ASF) 開發的一個開源專案
–目標是建立一些可伸縮的資料探勘演算法,供開發人員在Apache 在許可下免費使用。
–Mahout 包含許多實現,包括叢集、分類、CF 和進化程式。
–此外,通過使用Apache Hadoop庫,Mahout 可以有效地擴充套件到雲中。
Mahout的意思是大象的飼養者及驅趕者。
–Mahout 這個名稱來源於Hadoop徽標上的大象
–Mahout利用Hadoop來實現可伸縮性和容錯性。
Mahout與Hadoop家族其他主要成員關係
大資料探勘工具MLlib
MLlib是構建在Spark上的分散式資料探勘工具,利用Spark的記憶體計算,和適合迭代型計算的優勢,使效能大幅度提升。
•同時Spark運算元豐富的表現力,讓大規模資料探勘的演算法開發不再複雜
•MLlib作為Spark其中一部分,目前已經完全包含入Spark中。
資料探勘框架(Spark MLlib)
•MLlib是Spark對常用的資料探勘演算法的實現庫,同時包括相關的測試和資料生成器:
•MLlib目前支援多種常見的資料探勘問題:
–二元分類、迴歸、聚類以及協同過濾,同時也包括一個底層的梯度下降優化基礎演算法。
相關文章
- 資料探勘(5):使用mahout做海量資料關聯規則挖掘
- 資料探勘的資料分析方法
- 你知道資料庫索引的工作原理嗎?資料庫索引
- Python語言在資料探勘上非常有優勢,但它唯一的缺點你知道嗎?Python
- 資料探勘方向分析
- 常用資料探勘演算法演算法
- 常用的機器學習&資料探勘知識(點)機器學習
- 資料探勘中常用的取樣方法
- 大資料、資料分析、資料探勘的差別大資料
- 資料探勘的10種分析方法
- 大資料分析方法,你都知道哪些?大資料
- 你知道 go 切片的 copy 和 view 嗎GoView
- 你真的知道 == 和 equals 的區別嗎?
- 用Python做商業資料探勘,你學廢了嗎?Python
- 大資料常用分析工具介紹大資料
- 你知道MySQL是如何處理千萬級資料的嗎?MySql
- 你知道那幾種資料遷移工具?
- 社交網站的資料探勘與分析網站
- Lombok經常用,但是你知道它的原理是什麼嗎?Lombok
- 大資料技術人員工具包之—常見資料探勘分析處理工具大資料
- 淺談大資料、資料分析、資料探勘的區別!大資料
- 這3款資料探勘工具,你看中了哪一款?
- 學習Python必不可少的工具,你知道嗎?Python
- Python六大資料型別,你知道嗎?Python大資料資料型別
- 這些著名資料庫之間的“關係”,你知道嗎?資料庫
- 一篇文章讓你知道什麼是大資料探勘技術大資料
- 合理選擇資料探勘工具(轉)
- 常用資料庫選型!你做對了嗎?資料庫
- 你知道void和Void的區別嗎
- Python中常用的資料分析工具(模組)有哪些?Python
- 大資料視覺化分析工具常用的有哪些?大資料視覺化
- 資料探勘與資料分析的主要區別是什麼
- 你知道網頁設計中最常用的15張圖片素材嗎?網頁
- 資料探勘和資料提取能做什麼?
- 你真的知道JS嗎JS
- 大資料時代,如何做資料探勘與分析!大資料
- 萌新向Python資料分析及資料探勘 前言Python
- 資料分析與資料探勘 - 04科學計算