在eclipse中開發hadoop MapReduce

停不下的腳步發表於2014-12-19

EclipseHadoop

一.安裝hadoop for eclipse的外掛，注意：外掛版本要和hadoop版本一致。

下載：hadoop-eclipse-plugin-2.5.2.jar

http://download.csdn.net/detail/tondayong1981/8186269

將hadoop-eclipse-plugin-2.5.2.jar檔案放到ECLIPSE_HOME/plugins下，重啟eclipse

二.在eclipse中新建hadoop專案

File>New>other>Map/Reduce Project>next>輸入專案名>finish

點選右上角Map/Reduce檢視

現在能看見Map/Reduce Locations了，點選右側的紫色大象。

因為我們是yarn的環境所以不需要配置Map/Reduce(V2) Master 項

DFS Master中的IP和埠就是我們hadoop/etc/hadoop/core-site.xml中fs.defaultFS的值

現在我們就能看見遠端hadoop的HDFS了

三.在eclipce中執行Map/Reduce，以hadoop自帶的wordcount為例

首先下載hadoop的原始碼：

http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.5.2/

在hadoop-2.5.2-src ▸ hadoop-mapreduce-project ▸ hadoop-mapreduce-examples ▸ src ▸ main ▸ java ▸ org ▸ apache ▸ hadoop ▸ examples目錄中找到WordCount.java

將WordCount.java複製到剛才建的myhadoop專案的src下

建立資料來源檔案word.txt

在HDFS上建立輸入目錄，再將word.txt傳到HDFS上

$hadoop fs -mkdir /tmp/input

$hadoop fs -copyFromLocal /home/hadoop/word.txt /tmp/input/word.txt

回到eclipse 重新整理DFS將看到

執行WordCount.java

(1).在新建的專案Hadoop，點選WordCount.java，右鍵-->Run As-->Run Configurations

(2).在彈出的Run Configurations對話方塊中，點Java Application，右鍵-->New，這時會新建一個application名為WordCount

(3).配置執行引數，點Arguments，在Program arguments中輸入你要傳給程式的輸入資料夾和你要求程式將計算結果儲存的資料夾，如：

hdfs://10.6.9.226:9000/tmp/input/word.txt hdfs://10.6.9.226:9000/tmp/output

點選Run,等執行結束重新整理DFS Locations將會看到output資料夾

在我們平時開發中，我們可以在eclipse中編寫mapReduce，然後將工程導成JAR包，放到hadoop環境中，執行如下操作：

$hadoop jar <JAR包目錄> <hadoop例項名，如word count> <input目錄> <output目錄，確保不存在>

MapReduce 示例：減少 Hadoop MapReduce 中的側連線
2021-09-17
Hadoop
Android開發：在Eclipse中配置Android環境
2019-03-30
AndroidEclipse
Hadoop（十四）MapReduce概述
2024-09-18
Hadoop
hadoop_MapReduce yarn
2020-11-11
HadoopYarn
Hadoop學習——MapReduce
2019-04-06
Hadoop
在Docker容器中使用Hadoop執行Python MapReduce作業
2022-05-12
DockerHadoopPython
Hadoop面試題之MapReduce
2021-12-23
Hadoop面試題
Hadoop 專欄 - MapReduce 入門
2021-01-21
Hadoop
在eclipse中maven配置
2020-10-31
EclipseMaven
使用 Eclipse 在 Fedora 上進行 PHP 開發
2020-03-06
EclipsePHP
hadoop的mapreduce串聯執行
2018-09-01
Hadoop
Hadoop（三）通過C#/python實現Hadoop MapReduce
2022-05-01
HadoopC#Python
Hadoop（十九）MapReduce OutputFormat 資料壓縮
2024-09-19
HadoopORM
Hadoop面試題總結（三）——MapReduce
2021-10-16
Hadoop面試題
從分治演算法到 Hadoop MapReduce
2018-11-23
演算法Hadoop
Hadoop學習（二）——MapReduce\Yarn架構
2019-02-20
HadoopYarn架構
Ubuntu 16.04 Hadoop-2.7.3全分佈模式 + eclipse hadoop
2019-03-04
UbuntuHadoop模式Eclipse
Hadoop的mapreduce出現問題，報錯The auxService:mapreduce_shuffle does not exist
2020-12-24
HadoopUX
談談Hadoop MapReduce和Spark MR實現
2020-07-27
HadoopSpark
Hadoop之MapReduce2架構設計
2018-05-28
Hadoop架構
eclipse安裝Hadoop-0.20.2外掛
2019-02-24
EclipseHadoop
eclipse與hadoop-eclipse-plugin之間的版本對應關係
2019-03-29
EclipseHadoopPlugin
在eclipse中配置tomcat伺服器
2018-03-15
EclipseTomcat伺服器
hadoop 在centos中的搭建
2018-04-19
HadoopCentOS
Eclipse外掛開發demo
2022-02-28
Eclipse
使用Eclipse快速開發JSP
2020-10-17
EclipseJS
hadoop之mapreduce.input.fileinputformat.split.minsize引數
2018-10-24
HadoopORM
Hadoop 學習系列（四）之 MapReduce 原理講解
2019-03-04
Hadoop
Hadoop之MapReduce2基礎梳理及案例
2018-05-28
Hadoop
SpringBoot專案在Eclipse/MyEclipse中執行
2024-03-14
Spring BootEclipse
Hadoop學習第四天--MapReduce提交過程
2024-08-10
Hadoop
Hadoop框架：MapReduce基本原理和入門案例
2020-11-22
Hadoop框架
Hadoop 三劍客之 —— 分散式計算框架 MapReduce
2019-06-27
Hadoop分散式框架
Hadoop 系列（四）—— Hadoop 開發環境搭建
2019-08-07
Hadoop開發環境
JAVA開發工具Eclipse和MyEclipse
2024-01-03
JavaEclipse
使用eclipse 進行 Cesium 開發
2020-11-25
Eclipse
【大資料】MapReduce開發小實戰
2020-09-21
大資料
Spark與Hadoop MapReduce相比，有哪些優點你知道嗎？
2019-01-30
SparkHadoop
JavaWeb開發之Eclipse中jsp自動匯入類路徑
2018-06-04
JavaWebEclipseJS

在eclipse中開發hadoop MapReduce

相關文章