Spark獲取當前分割槽的partitionId
我的原創地址:
前言
本文講解Spark如何獲取當前分割槽的partitionId,這是一位群友提出的問題,其實只要透過TaskContext.get.partitionId(我是在官網上看到的),下面給出一些示例。
1、程式碼
下面的程式碼主要測試SparkSession,SparkContext建立的rdd和df是否都支援。
package com.dkl.leanring.partitionimport org.apache.spark.sql.SparkSessionimport org.apache.spark.TaskContext/** * 獲取當前分割槽的partitionId */object GetPartitionIdDemo { def main(args: Array[String]): Unit = { val spark = SparkSession.builder().appName("GetPartitionIdDemo").master("local").getOrCreate() val sc = spark.sparkContext val data = Seq(1, 2, 3, 4) // 測試rdd,三個分割槽 val rdd = sc.parallelize(data, 3) rdd.foreach(i => { println("partitionId:" + TaskContext.get.partitionId) }) import spark.implicits._ // 測試df,三個分割槽 val df = rdd.toDF("id") df.show df.foreach(row => { println("partitionId:" + TaskContext.get.partitionId) }) // 測試df,兩個分割槽 val data1 = Array((1, 2), (3, 4)) val df1 = spark.createDataFrame(data1).repartition(2) df1.show() df1.foreach(row => { println("partitionId:" + TaskContext.get.partitionId) }) } }
2、結果
[圖片上傳失敗...(image-ae7347-1533797078025)]
作者:董可倫
連結:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2249/viewspace-2815492/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- JavaScript 獲取當前月份JavaScript
- 獲取當前時間
- Spark RDD的預設分割槽數:(spark 2.1.0)Spark
- php 獲取當前域名和當前協議PHP協議
- Spark操作Hive分割槽表SparkHive
- Hive和Spark分割槽策略HiveSpark
- 獲取當前頁面的topViewControllerViewController
- Java獲取當前星期幾Java
- mybatis獲取當前時間MyBatis
- Flutter 小知識,Key的使用(獲取當前點選Widget位置/獲取當前Widget大小)Flutter
- 獲取當前Tomcat例項的埠Tomcat
- 獲取當前時間往前的日期
- Spark學習——分割槽Partition數Spark
- 安卓備份當前分割槽(需要root許可權)安卓
- Spark SQL解析查詢parquet格式Hive表獲取分割槽欄位和查詢條件SparkSQLHive
- python 如何獲取當前時間Python
- 用js獲取當前月份的天數JS
- js獲取當前的具體時間JS
- Apache Spark:分割槽和分桶 - NiveditaApacheSpark
- 聊聊Spark的分割槽、並行度 —— 前奏篇Spark並行
- Java如何獲取當前執行緒Java執行緒
- Linux C獲取當前工作目錄Linux
- 微信小程式獲取當前位置微信小程式
- Flutter獲取當前網路型別Flutter型別
- js根據IP地址獲取當前的省市JS
- 獲取當前修改的行記錄資料
- JVM 如何獲取當前容器的資源限制?JVM
- 如何用js獲取當前時間和ip地址以及當前城市JS
- PostgreSQL 原始碼解讀(96)- 分割槽表#3(資料插入路由#3-獲取分割槽鍵值)SQL原始碼路由
- react獲取當前頁面的url引數React
- C# 獲取當前伺服器域名C#伺服器
- python怎麼獲取當前是幾點?Python
- 如何用Java獲取當前時間戳?Java時間戳
- 直播app原始碼,uniapp獲取當前位置APP原始碼
- iOS獲取當前控制器的正確方式iOS
- 獲取當前js檔案被引用的路徑JS
- spark-運算元-分割槽運算元Spark
- 深入原始碼理解Spark RDD的資料分割槽原理原始碼Spark