在eclipse中開發hadoop MapReduce
一.安裝hadoop for eclipse的外掛,注意:外掛版本要和hadoop版本一致。
下載:hadoop-eclipse-plugin-2.5.2.jar
將hadoop-eclipse-plugin-2.5.2.jar檔案放到ECLIPSE_HOME/plugins下,重啟eclipse
二.在eclipse中新建hadoop專案
File>New>other>Map/Reduce Project>next>輸入專案名>finish
點選右上角Map/Reduce檢視
現在能看見Map/Reduce Locations了,點選右側的紫色大象。
因為我們是yarn的環境 所以不需要配置Map/Reduce(V2) Master 項
DFS Master中的IP和埠 就是我們hadoop/etc/hadoop/core-site.xml中fs.defaultFS的值
現在我們就能看見遠端hadoop的HDFS了
三.在eclipce中執行Map/Reduce,以hadoop自帶的wordcount為例
首先下載hadoop的原始碼:
在hadoop-2.5.2-src ▸ hadoop-mapreduce-project ▸ hadoop-mapreduce-examples ▸ src ▸ main ▸ java ▸ org ▸ apache ▸ hadoop ▸ examples目錄中找到WordCount.java
將WordCount.java複製到剛才建的myhadoop專案的src下
建立資料來源檔案word.txt
在HDFS上建立輸入目錄,再將word.txt傳到HDFS上
$hadoop fs -mkdir /tmp/input
$hadoop fs -copyFromLocal /home/hadoop/word.txt /tmp/input/word.txt
回到eclipse 重新整理DFS將看到
執行WordCount.java
(1).在新建的專案Hadoop,點選WordCount.java,右鍵-->Run As-->Run Configurations
(2).在彈出的Run Configurations對話方塊中,點Java Application,右鍵-->New,這時會新建一個application名為WordCount
(3).配置執行引數,點Arguments,在Program arguments中輸入你要傳給程式的輸入資料夾和你要求程式將計算結果儲存的資料夾,如:
hdfs://10.6.9.226:9000/tmp/input/word.txt hdfs://10.6.9.226:9000/tmp/output
點選Run,等執行結束重新整理DFS Locations將會看到output資料夾
在我們平時開發中,我們可以在eclipse中編寫mapReduce,然後將工程導成JAR包,放到hadoop環境中,執行如下操作:
$hadoop jar <JAR包目錄> <hadoop例項名,如word count> <input目錄> <output目錄,確保不存在>
相關文章
- MapReduce 示例:減少 Hadoop MapReduce 中的側連線Hadoop
- Android開發:在Eclipse中配置Android環境AndroidEclipse
- Hadoop(十四)MapReduce概述Hadoop
- hadoop_MapReduce yarnHadoopYarn
- Hadoop學習——MapReduceHadoop
- 在Docker容器中使用Hadoop執行Python MapReduce作業DockerHadoopPython
- Hadoop面試題之MapReduceHadoop面試題
- Hadoop 專欄 - MapReduce 入門Hadoop
- 在eclipse中maven配置EclipseMaven
- 使用 Eclipse 在 Fedora 上進行 PHP 開發EclipsePHP
- hadoop的mapreduce串聯執行Hadoop
- Hadoop(三)通過C#/python實現Hadoop MapReduceHadoopC#Python
- Hadoop(十九)MapReduce OutputFormat 資料壓縮HadoopORM
- Hadoop面試題總結(三)——MapReduceHadoop面試題
- 從分治演算法到 Hadoop MapReduce演算法Hadoop
- Hadoop學習(二)——MapReduce\Yarn架構HadoopYarn架構
- Ubuntu 16.04 Hadoop-2.7.3全分佈模式 + eclipse hadoopUbuntuHadoop模式Eclipse
- Hadoop的mapreduce出現問題,報錯The auxService:mapreduce_shuffle does not existHadoopUX
- 談談Hadoop MapReduce和Spark MR實現HadoopSpark
- Hadoop之MapReduce2架構設計Hadoop架構
- eclipse安裝Hadoop-0.20.2外掛EclipseHadoop
- eclipse與hadoop-eclipse-plugin之間的版本對應關係EclipseHadoopPlugin
- 在eclipse中配置tomcat伺服器EclipseTomcat伺服器
- hadoop 在centos中的搭建HadoopCentOS
- Eclipse外掛開發demoEclipse
- 使用Eclipse快速開發JSPEclipseJS
- hadoop之mapreduce.input.fileinputformat.split.minsize引數HadoopORM
- Hadoop 學習系列(四)之 MapReduce 原理講解Hadoop
- Hadoop之MapReduce2基礎梳理及案例Hadoop
- SpringBoot專案在Eclipse/MyEclipse中執行Spring BootEclipse
- Hadoop學習第四天--MapReduce提交過程Hadoop
- Hadoop框架:MapReduce基本原理和入門案例Hadoop框架
- Hadoop 三劍客之 —— 分散式計算框架 MapReduceHadoop分散式框架
- Hadoop 系列(四)—— Hadoop 開發環境搭建Hadoop開發環境
- JAVA開發工具Eclipse和MyEclipseJavaEclipse
- 使用eclipse 進行 Cesium 開發Eclipse
- 【大資料】MapReduce開發小實戰大資料
- Spark與Hadoop MapReduce相比,有哪些優點你知道嗎?SparkHadoop
- JavaWeb開發之Eclipse中jsp自動匯入類路徑JavaWebEclipseJS