pyspark 解析kafka陣列結構資料

Young_Mo發表於2024-11-07

from pyspark.sql.functions import get_json_object, col,from_unixtime, instr, length, regexp_replace, explode, from_json
from pyspark.sql.types import * 
# 定義陣列結構
schema = ArrayType(StructType([
        StructField("home", StringType()),
        StructField("room", StringType()),
        StructField("operation", StringType()),
        StructField("time", StringType())
    ]))

# kafka = kafka.select(col("value").cast("string").alias("data"))
# 使用from_json解析 再使用explode將陣列結構拆分成多行資料
kafka = kafka.select(from_json(col("value").cast("string"), schema).alias("data")
                     ).select(explode("data").alias("data")
                              ).selectExpr("data.home","data.room","data.operation",
                                           "data.time"
                                           )

資料結構-陣列
2024-03-26
資料結構陣列
資料結構 - 陣列
2024-09-26
資料結構陣列
資料結構之「陣列」
2019-03-18
資料結構陣列
資料結構之陣列
2018-10-02
資料結構陣列
資料結構2——陣列
2020-10-10
資料結構陣列
Java版-資料結構-陣列
2019-03-11
Java資料結構陣列
LeetCode之資料結構——陣列
2018-08-21
LeetCode資料結構陣列
JS資料結構(一)——陣列
2018-06-26
JS資料結構陣列
JavaScript資料結構01 - 陣列
2018-07-25
JavaScript資料結構陣列
資料結構——樹狀陣列
2024-09-17
資料結構陣列
Java版-資料結構-佇列（陣列佇列）
2019-03-14
Java資料結構佇列陣列
JavaScript資料結構之陣列棧佇列
2019-03-04
JavaScript資料結構陣列佇列
js實現資料結構--陣列
2018-11-23
JS資料結構陣列
基礎資料結構之陣列
2024-09-23
資料結構陣列
玩轉資料結構之陣列
2021-09-09
資料結構陣列
java資料結構學習之陣列
2018-06-23
Java資料結構陣列
（一）Java資料結構之稀疏陣列
2020-10-05
Java資料結構陣列
資料結構與演算法——陣列
2019-02-03
資料結構演算法陣列
資料結構之php實現陣列
2021-01-11
資料結構PHP陣列
資料結構之陣列和矩陣--矩陣&不規則二維陣列
2020-10-02
資料結構陣列矩陣
解析Pyspark如何讀取parquet資料
2020-04-15
Spark
資料結構與演算法 | 陣列(Array)
2023-10-16
資料結構演算法陣列
【資料結構與演算法】——稀疏陣列
2021-03-12
資料結構演算法陣列
PHP 陣列轉樹結構/樹結構轉陣列
2021-02-23
PHP陣列
資料結構與演算法—稀疏陣列和佇列
2019-07-15
資料結構演算法陣列佇列
資料結構與演算法學習-陣列
2019-03-07
資料結構演算法陣列
資料結構之真別多想—樹狀陣列
2020-09-12
資料結構陣列
資料結構與演算法之稀疏陣列
2020-10-05
資料結構演算法陣列
資料結構與演算法：稀疏陣列（一）
2020-11-08
資料結構演算法陣列
TypeScript演算法與資料結構-陣列篇
2019-07-09
TypeScript演算法資料結構陣列
Rust中陣列資料結構基礎知識
2024-07-03
Rust陣列資料結構
大資料開發過程中Kafka日誌結構解析
2022-07-28
大資料Kafka
資料結構--單連結串列（通過陣列實現）
2020-12-11
資料結構陣列
資料結構--陣列、單向連結串列、雙向連結串列
2018-08-26
資料結構陣列
資料結構與演算法整理總結---陣列，連結串列
2020-01-22
資料結構演算法陣列
陣列（ArrayPool陣列池、Span<T>結構）
2019-07-26
陣列
資料結構基礎學習之（串與陣列）
2019-04-05
資料結構陣列
JavaScript 的資料結構和演算法 - 陣列篇
2019-12-14
JavaScript資料結構演算法陣列

pyspark 解析kafka陣列結構資料

相關文章