大資料常用分析工具介紹
Hadoop: 一個分散式系統基礎架構,不僅執行在商用硬體系統,還可以輕鬆的整合結構化、半結構化資料集
MapReduce:是一種程式設計模型,用於大規模資料集(大於1TB)的並行運算。概念"Map(對映)"和"Reduce(歸約)",是它們的主要思想,
都是從函數語言程式設計語言裡借來的,還有從向量程式語言裡借來的特性。它極大地方便了程式設計人員在不會分散式並行程式設計的情況下,將自己的程式執行在分散式系統上。
Storm:用於處理高速大型資料流的分散式實時計算,為Apache Hadoop新增了可靠的實時處理功能,同時還增加了低延遲的儀表板和安全警報
Spark:最值得關注的大資料工具,是一個基於記憶體計算的開源的叢集計算系統,用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且執行速度比MapReduce快100倍
R:用於統計分析的R語言,透過擴充套件R+Hadoop,可以在Hadoop叢集上執行R程式碼
Mathout:將資料分析、分類以及篩選的演算法引入Hadoop叢集當中,輕鬆實現了大資料的分析挖掘工作
SAS:世界最老牌的資料分析和資料探勘軟體,憑藉Visaul Analytics軟體進入到大資料領域
SPSS:全球應用最廣泛的統計分析軟體,可用於統計學分析執行、資料探勘、預測分析和決策支援
RapidMiner:範圍廣泛,包括各種資料藝術,能簡化資料探勘過程的設計和評價
Apache Drill:實現了Google's Dremel,有助於Hadoop使用者實現更快的查詢海量資料集的目的
MapReduce:是一種程式設計模型,用於大規模資料集(大於1TB)的並行運算。概念"Map(對映)"和"Reduce(歸約)",是它們的主要思想,
都是從函數語言程式設計語言裡借來的,還有從向量程式語言裡借來的特性。它極大地方便了程式設計人員在不會分散式並行程式設計的情況下,將自己的程式執行在分散式系統上。
Storm:用於處理高速大型資料流的分散式實時計算,為Apache Hadoop新增了可靠的實時處理功能,同時還增加了低延遲的儀表板和安全警報
Spark:最值得關注的大資料工具,是一個基於記憶體計算的開源的叢集計算系統,用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且執行速度比MapReduce快100倍
R:用於統計分析的R語言,透過擴充套件R+Hadoop,可以在Hadoop叢集上執行R程式碼
Mathout:將資料分析、分類以及篩選的演算法引入Hadoop叢集當中,輕鬆實現了大資料的分析挖掘工作
SAS:世界最老牌的資料分析和資料探勘軟體,憑藉Visaul Analytics軟體進入到大資料領域
SPSS:全球應用最廣泛的統計分析軟體,可用於統計學分析執行、資料探勘、預測分析和決策支援
RapidMiner:範圍廣泛,包括各種資料藝術,能簡化資料探勘過程的設計和評價
Apache Drill:實現了Google's Dremel,有助於Hadoop使用者實現更快的查詢海量資料集的目的
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/15498/viewspace-2100333/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 大資料分析三大實用工具介紹!大資料
- Python資料分析--Numpy常用函式介紹(3)Python函式
- Python資料分析--Numpy常用函式介紹(2)Python函式
- 四種大資料分析方法介紹!大資料
- Python資料分析--工具安裝及Numpy介紹(1)Python
- JVM常用調優工具介紹JVM
- Java常用工具介紹Java
- 大資料視覺化分析工具常用的有哪些?大資料視覺化
- 資料字典生成工具及文件工具作用介紹
- 資料介面測試工具 Postman 介紹Postman
- 大資料崗位介紹-引子大資料
- 經典資料分析應用介紹
- Java常用的5大框架介紹!Java框架
- 資料科學領域的幾個無程式碼分析工具介紹資料科學
- 大資料 Hadoop介紹、配置與使用大資料Hadoop
- 大資料和Hadoop平臺介紹大資料Hadoop
- BBED修復資料庫常用命令介紹資料庫
- mysql 資料庫效能分析工具簡介MySql資料庫
- 好程式設計師大資料教程分享HDFS常用shell和web介面介紹程式設計師大資料Web
- Python資料分析--Numpy常用函式介紹(9)--Numpy中幾中常見的圖形Python函式
- Python資料分析--Numpy常用函式介紹(7)--Numpy中矩陣和通用函式Python函式矩陣
- Python資料分析--Numpy常用函式介紹(5)--Numpy中的相關性函式Python函式
- wireshark、異常資料分析、常見RST介紹
- 常用作業系統掃描工具介紹(轉)作業系統
- 「Premiere中文新手教程」PR常用剪輯工具介紹REM
- 大資料學習,大資料發展趨勢和Spark介紹大資料Spark
- 大資料分析工具有哪些特性大資料
- Python資料分析--Numpy常用函式介紹(4)--Numpy中的線性關係和資料修剪壓縮Python函式
- 《Hadoop大資料分析技術》簡介Hadoop大資料
- R資料分析:資料清洗的思路和核心函式介紹函式
- 資料庫介紹資料庫
- Java中大資料生態和4個工具介紹Java大資料
- 帶你入坑大資料(三) --- MapReduce介紹大資料
- 資深Linux運維工程師常用的10款軟體/工具介紹!Linux運維工程師
- NLPIR文字分析工具的功能和特色介紹
- 動態惡意軟體分析工具介紹
- MySQL全面瓦解3:資料型別介紹與分析MySql資料型別
- etcd 常用操作介紹
- Flutter 常用 Widget 介紹Flutter