hadoop基準測試_Hadoop TeraSort基準測試
hadoop基準測試
TeraSort is one of Hadoop’s widely used benchmarks. Hadoop’s distribution contains both the input generator and sorting implementations: the TeraGen generates the input and TeraSort conducts the sorting. Here, we provide a short tutorial for using the Hadoop TeraSort benchmark.
TeraSort是Hadoop廣泛使用的基準之一。 Hadoop的發行版包含輸入生成器和排序實現:TeraGen生成輸入,而TeraSort進行排序。 在這裡,我們提供了一個使用Hadoop TeraSort基準測試的簡短教程 。
TeraGen generates random data that can be used as input data for a subsequent running of TeraSort.
TeraGen生成隨機資料,可用作後續TeraSort執行的輸入資料。
通過TeraGen生成輸入 (Generate input by TeraGen)
The syntax for TeraGen:
TeraGen的語法:
$ hadoop jar hadoop-*examples*.jar teragen
<number of 100-byte rows> <output dir>
To make the TeraGen run on multiple nodes with multiple tasks, you may need to specify the number of map tasks (30 here as an example; for Hadoop 2):
為了使TeraGen在具有多個任務的多個節點上執行,您可能需要指定對映任務的數量(這裡以30個為例;對於Hadoop 2):
$ hadoop -D mapreduce.job.maps 30
jar hadoop-*examples*.jar teragen
<number of 100-byte rows> <output dir>
The number of mappers depends on the number of rows you will generate and the number of nodes you have. For more information on how to set the number of mappers and reducers, please check this post.
對映器的數量取決於您將生成的行數和擁有的節點數。 有關如何設定對映器和縮減器數量的更多資訊,請檢查此帖子 。
執行TeraSort (Run TeraSort)
After the data is generated, run the sort by TeraSort
生成資料後,按TeraSort執行排序
$ hadoop jar hadoop-*examples*.jar terasort
<input dir> <output dir>
You may also need to set the number of mappers and reducers for better performance.
您可能還需要設定對映器和化簡器的數量,以獲得更好的效能。
驗證TeraSort排序後的輸出資料 (Validate the sorted output data of TeraSort)
TeraValidate ensures that the output data of TeraSort is globally sorted.
TeraValidate確保TeraSort的輸出資料是全域性排序的。
The syntax for TeraValidate:
TeraValidate的語法:
$ hadoop jar hadoop-*examples*.jar teravalidate
<output dir> <terasort-validate dir>
翻譯自: https://www.systutorials.com/hadoop-terasort-benchmark/
hadoop基準測試
相關文章
- Hadoop TeraSort 基準測試實驗Hadoop
- hadoop-2.6.0基準測試Hadoop
- Hadoop測試TeraSortHadoop
- Hadoop安裝後的叢集基準測試Hadoop
- MySQL基準測試MySql
- TGI 基準測試
- 測試眼裡的Hadoop系列 之TerasortHadoop
- 測試基準資料的準備
- MYSQL 效能測試方法 - 基準測試(benchmarking)MySql
- MySQL學習 - 基準測試MySql
- 固態硬碟基準測試硬碟
- TPCC-MySQL基準測試MySql
- 【MYSQL 基準測試結果】MySql
- MySQL基準測試工具sysbenchMySql
- 《Redis官方教程》-基準測試Redis
- 【Mysql】sysbench基準測試工具MySql
- [轉帖]sysbench基準測試
- JMH- benchmark基準測試
- postgresql:pgbench基準效能測試SQL
- 【工具】基準測試工具之sysbench
- ubuntu 快速測試 cpu 基準水平Ubuntu
- 技術基礎 | Apache Cassandra 4.0基準測試Apache
- 資料庫基準測試工具 sysbench資料庫
- 公有云RDS-MySQL基準測試MySql
- 基準測試:HTTP/3 有多快? - requestmetricsHTTP
- 【MySQL】利用sysbench進行基準測試MySql
- MySQL基準壓力測試工具MySQLSlapMySql
- 【工具】基準測試工具之iozone
- Go 語言基準測試入門Go
- [總結] 簡述 MySQL 基準測試工具MySql
- 【總結】簡述 MySQL 基準測試工具MySql
- Java基準效能測試--JMH使用介紹Java
- 使用 JMH 做 Kotlin 的基準測試Kotlin
- 詳解 MySQL 基準測試和 sysbench 工具MySql
- 利用sysbench進行MySQL OLTP基準測試MySql
- 【工具】基準測試工具之tpcc-mysqlMySql
- MySQL效能基準測試對比:5.7 VS 8.0MySql
- Java JSON解析器效能基準測試JavaJSON