Spark2 DataSet 建立新行之flatMap

智慧先行者發表於2016-11-28

原文網址 : https://www.cnblogs.com/wwxbi/p/6110803.html

val dfList = List(("Hadoop", "Java,SQL,Hive,HBase,MySQL"), ("Spark", "Scala,SQL,DataSet,MLlib,GraphX"))
dfList: List[(String, String)] = List((Hadoop,Java,SQL,Hive,HBase,MySQL), (Spark,Scala,SQL,DataSet,MLlib,GraphX))

case class Book(title: String, words: String)

val df=dfList.map{p=>Book(p._1,p._2)}.toDS()
df: org.apache.spark.sql.Dataset[Book] = [title: string, words: string]

df.show
+------+--------------------+
| title|               words|
+------+--------------------+
|Hadoop|Java,SQL,Hive,HBa...|
| Spark|Scala,SQL,DataSet...|
+------+--------------------+

df.flatMap(_.words.split(",")).show
+-------+
|  value|
+-------+
|   Java|
|    SQL|
|   Hive|
|  HBase|
|  MySQL|
|  Scala|
|    SQL|
|DataSet|
|  MLlib|
| GraphX|
+-------+

RxJava2原始碼解讀之 Map、FlatMap
2018-08-05
RxJava原始碼
加速訓練之並行化 tf.data.Dataset 生成器
2022-06-11
並行
JavaScript dataset
2018-12-05
JavaScript
Tensorflow 1.x 之 dataset.make_initializable_iterator
2020-03-10
JDK8 flatmap函式
2024-03-26
JDK函式
【Dataset】Maple-IDS - Network Security Malicious Traffic Detection Dataset
2024-07-15
Mmdetection dataset pipline
2023-04-15
tensorflow dataset API
2020-12-18
API
聊聊Flux的compose與flatMap操作
2018-04-13
UX
更好用的map函式 flatMap
2022-01-13
函式
python建立新執行緒有哪些方法
2021-09-11
Python執行緒
Pytorch Dataset入門
2024-04-16
PyTorch
image-classification-dataset
2024-06-23
Spark入門（四）--Spark的map、flatMap、mapToPair
2019-02-28
SparkAPTAI
Dataset和Dataloader的使用
2023-01-05
Flink flatMap 使用lambda表示式異常問題
2023-11-28
flink batch dataset 的基本操作
2019-01-23
BAT
dataset、setAttribute()和getAttribute() 區別
2019-07-16
nodejs中使用worker_threads來建立新的執行緒
2021-01-21
NodeJSthread執行緒
賴立新先生辭任執行董事；黃賢貴先生辭任執行董事。
2022-01-23
Spark SQL學習——DataFrame和DataSet
2019-04-04
SparkSQL
05-快速理解SparkSQL的DataSet
2024-03-24
SparkSQL
CS209A Analysis of the Olympic Historical Dataset
2024-10-20
MLE 5217 : Take-Home Dataset Classification
2024-10-20
array.flatMap()：一個更智慧的 JavaScript 對映器
2022-02-17
JavaScript
Understanding Dataset Design Choices for Multi-hop Reasoning
2020-11-20
Pytorch入門上 —— Dataset、Tensorboard、Transforms、Dataloader
2021-12-15
PyTorchORBORM
使用java建立新的程序
2024-03-16
Java
建立新的 App 頁面
2024-10-08
APP
python中如何建立新表格
2021-09-11
Python
Spark API 全集(1):Spark SQL Dataset & DataFrame API
2018-12-09
SparkAPISQL
flink將bathch dataset 轉換為sql操作
2019-03-11
BATSQL
【小白學PyTorch】3 淺談Dataset和Dataloader
2020-09-01
PyTorch
Flink的DataSet基本運算元總結
2020-10-15
Pytorch建模過程中的DataLoader與Dataset
2023-01-04
PyTorch
厲害了，一個更智慧的 JavaScript 對映器：array.flatMap()
2022-02-01
JavaScript
win10建立新使用者 win10怎麼建立新使用者
2022-05-27
Win10
CentOS 7 - 建立新使用者
2018-12-06
CentOS
git 從master建立新的分支
2020-11-05
GitAST

Spark2 DataSet 建立新行之flatMap

相關文章