利用Hadoop執行第一個程式,計算文章中不同單詞數量
今天通過Hadoop來執行第一個程式,來統計一篇文章中不同英文單詞的個數。
1.建立一個 t1.txt 資料夾,並將你要統計的文章貼上進去。(這裡是將txt檔案建立在E盤中,跟Hadoop檔案同處於一個盤)
2.在命令提示符下 Hadoop-2.7.3\sbin 中輸入 start-all.cmd 開啟Hadoop服務
3.準備輸入、輸出資料夾,在HDFS檔案系統中建立。
Hadoop中所有的資料都必須放在HDFS檔案系統中進行處理。
命令提示符中 Hadoop-2.7.3\sbin 下輸入 hadoop fs -mkdir hdfs://localhost:9000/test/input(建立資料夾,localhost:9000為hdfs的系統目錄,test和input是現在要建立的檔名)
輸入 hadoop fs -ls hdfs://localhost:9000/test/ 檢視檔案是否建立成功
4.上傳需要統計的 t1 檔案到 hdfs://localhost:9000/test/input 上
hadoop fs -put E:\t1.txt hdfs://localhost:9000/test/input
wordcount.jar是Java編寫的一個MapReduce計算單詞數量的程式
6. 在jar包所在的路徑,執行以下命令 hadoop jar wordcount.jar hdfs://localhost:9000/test/input hdfs://localhost:9000/test/output,執行命令之後,顯示如下
7.hadoop fs -ls hdfs://localhost:9000/test/output檢視結果檔案
8.hadoop fs -cat hdfs://localhost:9000/test/output/patr-r-00000檢視輸出結果
9.hadoop fs -get hdfs://localhost:9000/test/output/patr-r-00000下載計算結果到本地
相關文章
- 第六篇:Eclipse上執行第一個Hadoop例項 - WordCount(單詞統計程式)EclipseHadoop
- python 統計文章單詞個數Python
- python 統計文章單詞個數-1Python
- python 統計文章單詞個數 -2Python
- 統計當前系統中不同執行狀態的程式數量
- 期末大作業關於利用hadoop來統計單詞數目Hadoop
- 統計檔案中單詞個數
- 統計一個字串中的單詞的個數,並列印各個單詞字串
- Hadoop--map/reduce實現單詞計數Hadoop
- Linux驅動程式:統計單詞個數Linux
- 執行計劃中Row 數量為0
- 使用map:單詞計數程式
- 【Flask】第一個Flask程式(安裝、執行引數、執行方式)Flask
- 推薦文章:多執行緒平行計算執行緒
- 如何讓兩個表單處於不同的執行緒中執行緒
- 多執行緒統計多個檔案的單詞數目---C++0x多執行緒使用示例執行緒C++
- Java在不同執行緒中執行程式碼Java執行緒行程
- **呼叫MapReduce對檔案中各個單詞出現的次數進行統計**
- python中單執行緒重複利用Python執行緒
- 在Linux中呼叫MapReduce對檔案中各個單詞出現次數進行統計Linux
- 輸入單價和數量自動計算價格程式碼
- 呼叫MapReduce對檔案中單詞出現次數進行統計
- js統計陣列中單詞出現次數程式碼例項JS陣列
- 完數的Java多執行緒並行程式設計-平行計算Java執行緒並行行程程式設計
- Python 計算程式執行多久程式碼Python
- 計算php程式執行時間的程式PHP
- WPS按工資計算不同面額的鈔票數量
- Centos檢視程式的執行緒數量CentOS執行緒
- storm詳解:第一章 storm分散式單詞計數ORM分散式
- C++ 統計單詞數C++
- java多執行緒:併發包中的訊號量和計數栓的程式設計模型Java執行緒程式設計模型
- 利用訊號量實現執行緒順序執行執行緒
- Stopwatch 計算程式執行時間
- 看板數量的計算
- 利用多執行緒寫一個賣票程式執行緒
- jupyter notebook 中執行展示控制行的數量
- 利用shell指令碼統計程式碼行數指令碼
- Java中計算整數中唯一數字數量的3種方法Java