Hadoop測試TeraSort
http://www.opstool.com/article/249
使用teragen產生資料
使用Teragen來產生資料,示例如下:
hadoop jar hadoop-*-examples.jar teragen 引數1 引數2
teragen的引數解釋:
- 引數1:表示要產生的資料的行數。Teragen每行資料的大小是100B。
要產生1T的資料,需要的行數=102410241024*1024/100=10995116277行 - 引數2 : 產生的資料放置的資料夾地址
預設的teragen的啟動的map數比較少,只有2個,如果要指定map數可以加-Dmapred.map.tasks=map數的方式。比如我們來產生1T的資料
hadoop jar hadoop-*-examples.jar teragen -Dmapred.map.tasks=100 10995116277 terasort/1T-input
ls一下目錄是否產出
hadoop@myhost $ hadoop fs -ls /user/hadoop/terasort/
Found 1 items
drwxr-xr-x - hadoop cug-admin 0 2013-07-13 12:49 /user/hadoop/terasort/1T-input
使用Terasort排序
使用terasort對剛才使用teragen產生的資料進行排序,排序結果輸出到/user/hadoop/terasort/1T-output。
預設的reduce數目是1,會導致任務跑得非常慢。通過-Dmapred.reduce.tasks指定reduce數目,這裡我們設定50個
hadoop jar hadoop-*-examples.jar terasort -Dmapred.reduce.tasks=50 \
/user/hadoop/terasort/1T-input /user/hadoop/terasort/1T-output
啟動Teragen之後,會提交mapre reduce任務來,產生TeraSort需要的資料
使用Teravalidate 進行驗證
使用TeraValidate 對Terasort的結果進行驗證:
hadoop jar hadoop-*-examples.jar teravalidate /user/hadoop/terasort/1T-output /user/hadoop/terasort/1T-validate
相關文件:
最新
最早
最熱
- 0條評論
相關文章
- hadoop基準測試_Hadoop TeraSort基準測試Hadoop
- Hadoop TeraSort 基準測試實驗Hadoop
- 測試眼裡的Hadoop系列 之TerasortHadoop
- Hadoop TerasortHadoop
- Hadoop的TeraSort問題Hadoop
- hadoop的terasort排序總結Hadoop排序
- Hadoop學習筆記 - Sort / TeraSort / TestDFSIOHadoop筆記
- Hadoop-MapReduce-TeraSort-大資料排序例子Hadoop大資料排序
- Hadoop測試常見問題和測試方法Hadoop
- hadoop2.4.1_WordCount測試Hadoop
- 2. TeraSort在Hadoop分散式叢集中的執行Hadoop分散式
- 修改 Hadoop TeraSort演算法 —— 按照LongWritable型別的Key排序Hadoop演算法型別排序
- hadoop-2.6.0基準測試Hadoop
- Hadoop學習筆記之TeraSort修改後輸出翻倍異常Hadoop筆記
- 大資料測試之hadoop初探大資料Hadoop
- 學習七:Hadoop小程式測試Hadoop
- Hadoop TeraSort演算法之2-trie樹構造時間解惑Hadoop演算法
- Spark 與 Hadoop 關於 TeraGen/TeraSort 的對比實驗(包含原始碼)SparkHadoop原始碼
- 小白學習大資料測試之hadoop大資料Hadoop
- 1.單機部署hadoop測試環境Hadoop
- Hadoop打包與測試工具Bigtop簡介OHHadoop
- 在Hadoop中使用MRUnit進行單元測試Hadoop
- hadoop單機安裝配置及測試通過Hadoop
- Hadoop安裝後的叢集基準測試Hadoop
- 測試測試測試測試測試測試
- hadoop權威指南上 天氣例子測試執行Hadoop
- Hadoop2.2.0多節點分散式安裝及測試Hadoop分散式
- 手把手教你搭建hadoop+hive測試環境(新手向)HadoopHive
- App測試、Web測試和介面測試一般測試流程APPWeb
- 介面測試測試流程
- 《Hadoop基礎教程》 試讀Hadoop
- Flutter 學習之路 - 測試(單元測試,Widget 測試,整合測試)Flutter
- 介面測試,負載測試,併發測試,壓力測試區別負載
- 黑盒測試、白盒測試、單元測試、整合測試、系統測試、驗收測試的區別與聯絡...
- 測試CMS同步測試CMS同步測試CMS同步
- (一)效能測試(壓力測試、負載測試)負載
- 認識軟體測試步測試測試 (轉)
- 小白學習大資料測試之hadoop hdfs和MapReduce小實戰大資料Hadoop