Spark運算元:RDD行動Action操作學習–countByKey、foreach、sortBy
package chen
import org.apache.spark._
object rdd_test {
System.setProperty ("hadoop.home.dir", "C:\\hadoop_home\\")
def main(args: Array[String]) {
/*
* countByKey for foreach sortBy 學習
*
*/
val sparkConf = new SparkConf().setMaster("local").setAppName("rdd")
val sc = new SparkContext(sparkConf)
val rdd1 = sc.makeRDD(Array(("A", 0), ("A", 2), ("B", 1), ("B", 2), ("B", 3)))
rdd1.foreach(println(_))
/*
(A,0)
(A,2)
(B,1)
(B,2)
(B,3)
*/
for (elem <- rdd1.countByKey) {
println(elem)
}
/*
(B,3)
(A,2)
*/
var cnt = sc.accumulator(0)
val rdd2 = sc.makeRDD(1 to 10,2)
rdd2.foreach(println(_)) //輸出: 1 2 3 4 5 6 7 8 9 10
rdd2.foreach(x => cnt += x)
println(cnt) //55
val rdd3 = sc.makeRDD(Seq(3,6,7,1,2,0),2)
rdd3.sortBy(x => x).collect.foreach(println(_)) // 0, 1, 2, 3, 6, 7 預設升序
rdd3.sortBy(x => x, false).collect.foreach(println(_)) // 7, 6, 3, 2, 1, 0 降序
//RDD[K,V]型別
//按照kye來排序
rdd1.sortBy(x=>x).collect().foreach(println(_))
//按照value的升序排列,false就降序
rdd1.sortBy(x=>x._2, true).collect().foreach(println(_))
/*
(A,0)
(B,1)
(A,2)
(B,2)
(B,3)
*/
}
}
相關文章
- Spark RDD運算元(八)mapPartitions, mapPartitionsWithIndexSparkAPPIndex
- spark RDD運算元(五)之鍵值對聚合操作combineByKeySpark
- Spark----RDD運算元分類 DAGSpark
- 圖解Spark排序運算元sortBy的核心原始碼圖解Spark排序原始碼
- 【Spark Java API】Action(4)—sortBy、taSparkJavaAPI
- RDD運算元
- spark學習筆記--RDD鍵對操作Spark筆記
- spark RDD textFile運算元 分割槽數量詳解Spark
- 【Spark Java API】Action(3)—foreach、fSparkJavaAPI
- spark學習筆記--RDDSpark筆記
- Spark運算元:統計RDD分割槽中的元素及數量Spark
- Spark學習(二)——RDD基礎Spark
- spark-運算元-分割槽運算元Spark
- 大資料學習—Spark核心概念RDD大資料Spark
- 【Spark篇】---SparkStreaming中運算元中OutPutOperator類運算元Spark
- Spark常用Transformations運算元(一)SparkORM
- RDD轉換操作運算元 --- zip(k-v)、join(k)、cogroup(k)、lookup(k)
- Spark效能調優-RDD運算元調優篇(深度好文,面試常問,建議收藏)Spark面試
- spark一些常用運算元Spark
- spark RDD的學習,filter函式的學習,split函式的學習SparkFilter函式
- Python學習:運算元據庫Python
- Flink -- Operator操作運算元
- 大資料教程:Transformation和Action運算元演示大資料ORM
- spark-RDDSpark
- Spark RDD APISparkAPI
- 深度學習運算元優化-FFT深度學習優化FFT
- Spark - [03] RDD概述Spark
- foreach 實現 MyBatis 遍歷集合與批量運算元據MyBatis
- Spark效能優化:對RDD持久化或CheckPoint操作Spark優化持久化
- 深度學習運算元最佳化-FFT深度學習FFT
- spark的基本運算元使用和原始碼解析Spark原始碼
- spark RDD,reduceByKey vs groupByKeySpark
- Spark 的核心概念 RDDSpark
- 機器學習系列-tensorflow-02-基本操作運算機器學習
- Spark RDD 特徵及其依賴Spark特徵
- Spark RDD中Runtime流程解析Spark
- SparkSQL /DataFrame /Spark RDD誰快?SparkSQL
- spark學習筆記--叢集執行SparkSpark筆記
- 學習位運算