大資料常用分析工具介紹
Hadoop: 一個分散式系統基礎架構,不僅執行在商用硬體系統,還可以輕鬆的整合結構化、半結構化資料集
MapReduce:是一種程式設計模型,用於大規模資料集(大於1TB)的並行運算。概念"Map(對映)"和"Reduce(歸約)",是它們的主要思想,
都是從函數語言程式設計語言裡借來的,還有從向量程式語言裡借來的特性。它極大地方便了程式設計人員在不會分散式並行程式設計的情況下,將自己的程式執行在分散式系統上。
Storm:用於處理高速大型資料流的分散式實時計算,為Apache Hadoop新增了可靠的實時處理功能,同時還增加了低延遲的儀表板和安全警報
Spark:最值得關注的大資料工具,是一個基於記憶體計算的開源的叢集計算系統,用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且執行速度比MapReduce快100倍
R:用於統計分析的R語言,透過擴充套件R+Hadoop,可以在Hadoop叢集上執行R程式碼
Mathout:將資料分析、分類以及篩選的演算法引入Hadoop叢集當中,輕鬆實現了大資料的分析挖掘工作
SAS:世界最老牌的資料分析和資料探勘軟體,憑藉Visaul Analytics軟體進入到大資料領域
SPSS:全球應用最廣泛的統計分析軟體,可用於統計學分析執行、資料探勘、預測分析和決策支援
RapidMiner:範圍廣泛,包括各種資料藝術,能簡化資料探勘過程的設計和評價
Apache Drill:實現了Google's Dremel,有助於Hadoop使用者實現更快的查詢海量資料集的目的
MapReduce:是一種程式設計模型,用於大規模資料集(大於1TB)的並行運算。概念"Map(對映)"和"Reduce(歸約)",是它們的主要思想,
都是從函數語言程式設計語言裡借來的,還有從向量程式語言裡借來的特性。它極大地方便了程式設計人員在不會分散式並行程式設計的情況下,將自己的程式執行在分散式系統上。
Storm:用於處理高速大型資料流的分散式實時計算,為Apache Hadoop新增了可靠的實時處理功能,同時還增加了低延遲的儀表板和安全警報
Spark:最值得關注的大資料工具,是一個基於記憶體計算的開源的叢集計算系統,用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且執行速度比MapReduce快100倍
R:用於統計分析的R語言,透過擴充套件R+Hadoop,可以在Hadoop叢集上執行R程式碼
Mathout:將資料分析、分類以及篩選的演算法引入Hadoop叢集當中,輕鬆實現了大資料的分析挖掘工作
SAS:世界最老牌的資料分析和資料探勘軟體,憑藉Visaul Analytics軟體進入到大資料領域
SPSS:全球應用最廣泛的統計分析軟體,可用於統計學分析執行、資料探勘、預測分析和決策支援
RapidMiner:範圍廣泛,包括各種資料藝術,能簡化資料探勘過程的設計和評價
Apache Drill:實現了Google's Dremel,有助於Hadoop使用者實現更快的查詢海量資料集的目的
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-2100333/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料分析三大實用工具介紹!大資料
- 常用Oracle資料庫調優工具介紹Oracle資料庫
- 四種大資料分析方法介紹!大資料
- Python資料分析--Numpy常用函式介紹(2)Python函式
- Python資料分析--Numpy常用函式介紹(3)Python函式
- ORACLE常用資料字典介紹Oracle
- 大資料視覺化分析工具常用的有哪些?大資料視覺化
- Java常用工具介紹Java
- JVM常用調優工具介紹JVM
- Python資料分析--工具安裝及Numpy介紹(1)Python
- 大資料核心元件介紹大資料元件
- Tkprof工具介紹和分析
- MongoDB常用工具集介紹MongoDB
- 大資料崗位介紹-引子大資料
- 資料字典生成工具及文件工具作用介紹
- 資料介面測試工具 Postman 介紹Postman
- MongoDB資料比較工具dbHash介紹MongoDB
- Tkprof工具介紹和分析[轉]]
- Java常用的5大框架介紹!Java框架
- 經典資料分析應用介紹
- Docker介紹 安裝 常用工具Docker
- 資料科學領域的幾個無程式碼分析工具介紹資料科學
- 資料倉儲—報表工具—MicroStrategy 介紹ROS
- 常用的四種大資料分析方法大資料
- mysql 資料庫效能分析工具簡介MySql資料庫
- 大資料 Hadoop介紹、配置與使用大資料Hadoop
- 大資料和Hadoop平臺介紹大資料Hadoop
- 大資料:CDH和Cloudera Express的介紹大資料CloudExpress
- BBED修復資料庫常用命令介紹資料庫
- 好程式設計師大資料教程分享HDFS常用shell和web介面介紹程式設計師大資料Web
- 大資料學習,大資料發展趨勢和Spark介紹大資料Spark
- 大資料分析工具有哪些特性大資料
- percona之資料庫開發工具介紹資料庫
- MySQL資料庫備份工具Mydumper使用介紹MySql資料庫
- hadoop匯入資料工具sqoop介紹Hadoop
- 資料倉儲—報表工具—Congos 介紹Go
- 關於資料倉儲 — 總體工具介紹
- wireshark、異常資料分析、常見RST介紹