如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大資料和執行預測分析。藉助開源與雲端計算技術,新興公司甚至在很多方面都可以與大廠商抗衡。
以下是一些大資料方面的頂級開源工具,分為四個領域:資料儲存、開發平臺、開發工具和整合、分析和報告工具。
資料儲存:
- Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
- NoSql 資料庫 – MongoDB, Cassandra, Hbase
- SQL 資料庫 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB
開發平臺:
- Apache Hadoop平臺 – Impala(開源大資料分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(開源大資料應用程式開發框架)
- Apache Lucene和 Solr平臺
- OpenStack(構建私有云和公有云)
- Red Hat (搭載 Hadoop 伺服器的標準 Linux 發行版)
- REEF(微軟的Hadoop開發者平臺)
- Storm(整合了各種排隊系統和資料庫系統)
開發工具和整合:
- Apache Mahout(機器學習的程式語言)
- Python 和 R(預測分析程式語言)
分析和報告工具:
- Jaspersoft(報告和分析伺服器)
- Pentaho(資料整合和業務分析)
- Splunk(IT分析平臺)
- Talend(大資料整合,資料管理和應用整合)
以上就是我們總結的大資料方面不錯的工具,希望對您有所幫助。
英文原文: blackducksoftware
評論(1)