eclipse Java Spark local模式
1、新建工程,引入一下spark2.4.0的lib依賴
2、測試程式碼:
import java.util.Arrays;
import java.util.List;
import java.util.regex.Pattern;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.sql.SparkSession;
import scala.Tuple2;
public class SparkWordCount {
private static final Pattern SPACE = Pattern.compile(" ");
public static void main(String[] args) throws Exception {
SparkConf conf = new SparkConf().setMaster("local");
SparkSession spark = SparkSession.builder().appName("JavaWordCount").config(conf).getOrCreate();
JavaRDD<String> lines = spark.read().textFile("f:/wordCount.txt").javaRDD();
JavaRDD<String> words = lines.flatMap(s -> Arrays.asList(SPACE.split(s)).iterator());
JavaPairRDD<String, Integer> ones = words.mapToPair(s -> new Tuple2<>(s, 1));
JavaPairRDD<String, Integer> counts = ones.reduceByKey((i1, i2) -> i1 + i2);
List<Tuple2<String, Integer>> output = counts.collect();
for (Tuple2<?, ?> tuple : output) {
System.out.println(tuple._1() + ": " + tuple._2());
}
Thread.sleep(500000);// 可以訪問http://localhost:4040 檢視UI介面
spark.stop();
}
}
相關文章
- 01-Spark的Local模式與應用開發入門Spark模式
- hadoop3.1.3 local 模式配置Hadoop模式
- Eclipse lombok javaEclipseLombokJava
- SpringBoot專案遠端Debug模式(Eclipse)Spring Boot模式Eclipse
- java時斷時續————eclipseJavaEclipse
- flink1.10版local模式提交job流程分析模式
- Java新提案:Extent-Local變數Java變數
- Spark叢集部署(standLone)模式Spark模式
- Spark Standalone模式 高可用部署Spark模式
- JAVA開發工具Eclipse和MyEclipseJavaEclipse
- eclipse關聯java的原始碼EclipseJava原始碼
- Spark - [03] 資源排程模式Spark模式
- JAVA java學習(22)——————Eclipse 修改字符集JavaEclipse
- 【Spark篇】---SparkStreaming+Kafka的兩種模式receiver模式和Direct模式SparkKafka模式
- spark 2.1.0 standalone模式配置&&打包jar包透過spark-submit提交Spark模式JARMIT
- TensorFlow Java+eclipse下環境搭建JavaEclipse
- 大資料Spark叢集模式配置大資料Spark模式
- 部署Spark2.2叢集(on Yarn模式)SparkYarn模式
- 部署spark2.2叢集(standalone模式)Spark模式
- Ubuntu 16.04 Hadoop-2.7.3全分佈模式 + eclipse hadoopUbuntuHadoop模式Eclipse
- java11新特性--Local-Variable Syntax for Lambda ParametersJava
- 淺談1——用Eclipse除錯JAVA程式Eclipse除錯Java
- Local Storage
- Spark3.0.1各種叢集模式搭建Spark模式
- Windows上搭建Standalone模式的Spark環境Windows模式Spark
- 深入理解Spark 2.1 Core (五):Standalone模式Spark模式
- Builgen 外掛——IntelliJ IDEA和Eclipse Java Bean Builder模式程式碼生成器-比lombok更符合需求...UIIntelliJIdeaEclipseJavaBean模式Lombok
- 【Spark Java API】Action(3)—foreach、fSparkJavaAPI
- 【Spark Java API】Action(4)—sortBy、taSparkJavaAPI
- maven建立Java 和 Web Project, 並匯入EclipseMavenJavaWebProjectEclipse
- nebula-br local-store 模式,快速搭建主備叢集實踐模式
- thread local in pythonthreadPython
- Spark3學習【基於Java】3. Spark-Sql常用APISparkJavaSQLAPI
- Java橋模式(Bridge模式)Java模式
- Eclipse中設定作者日期等Java註釋模板EclipseJava
- 使用 Eclipse 遠端除錯 Java 應用程式(mark)Eclipse除錯Java
- 如何使用eclipse軟體建立一個Java專案?EclipseJava
- java怎麼匯入專案?java已有專案如何匯入eclipse?JavaEclipse