Hadoop測試TeraSort
http://www.opstool.com/article/249
使用teragen產生資料
使用Teragen來產生資料,示例如下:
hadoop jar hadoop-*-examples.jar teragen 引數1 引數2
teragen的引數解釋:
- 引數1:表示要產生的資料的行數。Teragen每行資料的大小是100B。
要產生1T的資料,需要的行數=102410241024*1024/100=10995116277行 - 引數2 : 產生的資料放置的資料夾地址
預設的teragen的啟動的map數比較少,只有2個,如果要指定map數可以加-Dmapred.map.tasks=map數的方式。比如我們來產生1T的資料
hadoop jar hadoop-*-examples.jar teragen -Dmapred.map.tasks=100 10995116277 terasort/1T-input
ls一下目錄是否產出
hadoop@myhost $ hadoop fs -ls /user/hadoop/terasort/
Found 1 items
drwxr-xr-x - hadoop cug-admin 0 2013-07-13 12:49 /user/hadoop/terasort/1T-input
使用Terasort排序
使用terasort對剛才使用teragen產生的資料進行排序,排序結果輸出到/user/hadoop/terasort/1T-output。
預設的reduce數目是1,會導致任務跑得非常慢。通過-Dmapred.reduce.tasks指定reduce數目,這裡我們設定50個
hadoop jar hadoop-*-examples.jar terasort -Dmapred.reduce.tasks=50 \
/user/hadoop/terasort/1T-input /user/hadoop/terasort/1T-output
啟動Teragen之後,會提交mapre reduce任務來,產生TeraSort需要的資料
使用Teravalidate 進行驗證
使用TeraValidate 對Terasort的結果進行驗證:
hadoop jar hadoop-*-examples.jar teravalidate /user/hadoop/terasort/1T-output /user/hadoop/terasort/1T-validate
相關文件:
最新
最早
最熱
- 0條評論
相關文章
- hadoop基準測試_Hadoop TeraSort基準測試Hadoop
- 2. TeraSort在Hadoop分散式叢集中的執行Hadoop分散式
- Hadoop測試常見問題和測試方法Hadoop
- 大資料測試之hadoop初探大資料Hadoop
- 小白學習大資料測試之hadoop大資料Hadoop
- Hadoop打包與測試工具Bigtop簡介OHHadoop
- 手把手教你搭建hadoop+hive測試環境(新手向)HadoopHive
- 測試測試測試測試測試測試
- Hadoop面試題總結Hadoop面試題
- Hadoop常見面試題Hadoop面試題
- Hadoop面試題之HDFSHadoop面試題
- Hadoop叢集面試題Hadoop面試題
- Hadoop面試題之MapReduceHadoop面試題
- Hadoop面試題(四)——YARNHadoop面試題Yarn
- 小白學習大資料測試之hadoop hdfs和MapReduce小實戰大資料Hadoop
- Hadoop 面試,有它就夠了Hadoop面試
- Hadoop二十道面試問題Hadoop面試
- Hadoop 管理員面試問題Hadoop面試
- Hadoop二十道面試問題(2)Hadoop面試
- 面試Hadoop DBA的重要問題面試Hadoop
- Hadoop面試題總結(三)——MapReduceHadoop面試題
- 測試—測試方法
- 測試測試用
- Flutter 學習之路 - 測試(單元測試,Widget 測試,整合測試)Flutter
- App測試、Web測試和介面測試一般測試流程APPWeb
- 測試面試-測試用例面試
- 介面測試測試流程
- 介面測試,負載測試,併發測試,壓力測試區別負載
- 測試CMS同步測試CMS同步測試CMS同步
- (一)效能測試(壓力測試、負載測試)負載
- 介面測試 - 引數測試
- Jmeter介面測試+效能測試JMeter
- 【軟體測試】——介面測試
- 微服務測試之介面測試和契約測試微服務
- 測試 之Java單元測試、Android單元測試JavaAndroid
- 黑盒測試、白盒測試與灰盒測試方法
- Hadoop/Spark相關面試問題總結HadoopSpark面試
- 技術乾貨:Hadoop面試題及答案Hadoop面試題
- 功能測試、自動化測試、效能測試的區別