spark MapPartitionsRDD

鴨梨山大哎發表於2020-11-20

原文網址 : https://blog.csdn.net/u010711495/article/details/109839681

private[spark] class MapPartitionsRDD[U: ClassTag, T: ClassTag](
    var prev: RDD[T],
    f: (TaskContext, Int, Iterator[T]) => Iterator[U],  // (TaskContext, partition index, iterator)
    preservesPartitioning: Boolean = false,
    isOrderSensitive: Boolean = false)
  extends RDD[U](prev) {

  override val partitioner = if (preservesPartitioning) firstParent[T].partitioner else None

  override def getPartitions: Array[Partition] = firstParent[T].partitions

  override def compute(split: Partition, context: TaskContext): Iterator[U] =
    f(context, split.index, firstParent[T].iterator(split, context))

  override def clearDependencies() {
    super.clearDependencies()
    prev = null
  }

  override protected def getOutputDeterministicLevel = {
    if (isOrderSensitive && prev.outputDeterministicLevel == DeterministicLevel.UNORDERED) {
      DeterministicLevel.INDETERMINATE
    } else {
      super.getOutputDeterministicLevel
    }
  }
}

Spark之spark shell
2018-09-13
Spark
Spark on Yarn 和Spark on Mesos
2018-11-20
SparkYarn
Spark系列 - (3) Spark SQL
2023-02-23
SparkSQL
Spark學習進度-Spark環境搭建&Spark shell
2021-01-04
Spark
【Spark】Spark容錯機制
2021-09-09
Spark
spark
2022-07-05
Spark
spark學習筆記--Spark SQL
2018-07-13
Spark筆記SQL
spark學習筆記-- Spark Streaming
2018-08-03
Spark筆記
Spark 系列（十四）—— Spark Streaming 基本操作
2019-08-14
Spark
Spark 系列（十五）—— Spark Streaming 整合 Flume
2019-08-15
Spark
【Spark篇】---Spark故障解決（troubleshooting）
2018-03-04
Spark
Spark記錄（一）：Spark全景概述
2021-11-06
Spark
Spark SQL | Spark，從入門到精通
2019-01-21
SparkSQL
spark2.2.0 配置spark sql 操作hive
2018-09-23
SparkSQLHive
Hello Spark! | Spark，從入門到精通
2018-09-18
Spark
Spark 系列（九）—— Spark SQL 之 Structured API
2019-08-13
SparkSQLStructAPI
Spark文件閱讀之一：Spark Overview
2020-06-15
SparkView
Spark學習筆記（三）-Spark Streaming
2020-06-24
Spark筆記
Spark —— Spark OOM Error問題排查定位
2020-11-22
SparkOOMError
spark with hive
2018-11-21
SparkHive
Spark 加入
2022-09-23
Spark
Spark Stage
2021-09-09
Spark
Spark & Zeppelin
2021-09-09
Spark
Spark入門（四）--Spark的map、flatMap、mapToPair
2019-02-28
SparkAPTAI
Spark in action on Kubernetes - Spark Operator的原理解析
2019-04-03
Spark
Spark API 全集(1):Spark SQL Dataset & DataFrame API
2018-12-09
SparkAPISQL
Spark SQL:4.對Spark SQL的理解
2018-12-08
SparkSQL
Spark入門（五）--Spark的reduce和reduceByKey
2019-03-01
Spark
Spark 系列（十一）—— Spark SQL 聚合函式 Aggregations
2019-08-14
SparkSQL函式
Spark 以及 spark streaming 核心原理及實踐
2019-01-05
Spark
【Spark篇】---Spark中Shuffle檔案的定址
2018-03-07
Spark
Spark Streaming + Spark SQL 實現配置化ET
2021-09-09
SparkSQL
spark與kafaka整合workcount示例 spark-stream-kafka
2018-10-19
SparkKafka
Spark（十三） Spark效能調優之RDD持久化
2019-01-15
Spark持久化
spark學習筆記--叢集執行Spark
2018-07-12
Spark筆記
Spark之HiveSupport連線（spark-shell和IDEA）
2018-09-17
SparkHiveIdea
1.Spark學習(Python版本)：Spark安裝
2018-07-24
SparkPython
Spark Streaming監聽HDFS檔案（Spark-shell）
2024-11-04
Spark

spark MapPartitionsRDD

相關文章