第一次嘗試使用java寫spark
package hgs.spark; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.api.java.function.FlatMapFunction; import org.apache.spark.api.java.function.Function2; import org.apache.spark.api.java.function.PairFlatMapFunction; import scala.Tuple2; public class JavaRDDWC { public static void main(String[] args) { //System.setProperty("HADOOP_USER_NAME","administrator"); //需要hadoop windows的winutils.exe System.setProperty("hadoop.home.dir", "D:\\hadoop-2.7.1"); SparkConf conf = new SparkConf().setAppName("javawc").setMaster("local[2]"); @SuppressWarnings("resource") JavaSparkContext context = new JavaSparkContext(conf); JavaRDD<String> rdd = context.textFile("D:\\test.txt"); //split成陣列 JavaRDD<String[]> rdd1 = rdd.map(s -> s.split(",")); //只有pairrdd才可以reducebykey JavaPairRDD<String, Integer> rdd2 = rdd1.flatMapToPair(new flatMapFunc()); JavaPairRDD<String, Integer> rdd3 = rdd2.reduceByKey(new reducefunc()); rdd3.saveAsTextFile("D:\\fff"); context.stop(); } } class reducefunc implements Function2<Integer, Integer, Integer>{ /** * */ private static final long serialVersionUID = 1L; @Override public Integer call(Integer v1, Integer v2) throws Exception { return v1+v2; } } class flatmf implements FlatMapFunction<String[], String>{ /** * */ private static final long serialVersionUID = 1L; @Override public Iterator<String> call(String[] t) throws Exception { List<String> list = new ArrayList<>(); for(String str : t) { list.add(str); } return list.iterator(); } } class flatMapFunc implements PairFlatMapFunction<String[], String, Integer>{ /** * */ private static final long serialVersionUID = 1L; @Override public Iterator<Tuple2<String, Integer>> call(String[] t) throws Exception { List<Tuple2<String,Integer>> list = new ArrayList<>(); for(String str : t) { list.add(new Tuple2<String, Integer>(str, 1)); } return list.iterator(); } }
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31506529/viewspace-2646105/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 第一次嘗試編寫javaJava
- grpc 的第一次嘗試RPC
- 第一次嘗試鴻蒙開發鴻蒙
- 嘗試手寫promisePromise
- laravel 5.5 嘗試使用 typescript 編寫 vue 元件LaravelTypeScriptVue元件
- 第一次網站初嘗試爬的坑網站
- 嘗試手寫一個註解框架框架
- 嘗試
- 第一次嘗試獨立開發的經驗和感悟
- 嘗試說一說事件的使用事件
- 嘗試使用 pack 與 unpack 函式函式
- 嘗試使用 docker 部署 Laravel 專案DockerLaravel
- 嘗試寫個UC瀏覽器(佈局篇)瀏覽器
- JAVAFX嘗試Java
- 嘗試1
- 嘗試寫個UC瀏覽器(堆疊檢視A)瀏覽器
- 初嘗試swiftSwift
- ios NFC嘗試iOS
- 嘗試用go寫一個音樂搜尋的包Go
- 嘗試自己動手用react來寫一個分頁元件React元件
- 嘗試寫個UC瀏覽器(主頁互動篇)瀏覽器
- 嘗試使用Knative建立一個應用
- 嘗試使用data pump時出錯解決
- Java HttpClient 學習記錄 2 嘗試Get請求JavaHTTPclient
- 實戰|使用Spark Streaming寫入HudiSpark
- 嘗試 LeetcodeLeetCode
- 初次嘗試HTTPSHTTP
- Redis crackit 漏洞嘗試Redis
- Linux小白菜嘗試寫學習筆記日記Linux筆記
- 為了學好Java,我嘗試了這 6 個方法Java
- 嘗試 Leetcode(二)LeetCode
- 微信小程式 TypeScript 嘗試微信小程式TypeScript
- oracle函式初次嘗試Oracle函式
- mview on prebuilt table用法嘗試ViewUI
- 第一次使用微信掃碼支付_JavaJava
- 《快樂碼農》第7期 嘗試在帳篷中寫程式碼
- 基於 Redis 的 LBS 嘗試Redis
- MyBatis Generator嘗試與踩坑MyBatis