Spark SQL的官網解釋

yunqiublog發表於2019-08-09

原文網址 : http://blog.itpub.net/69941978/viewspace-2653164/

一.官網位置

1.位置

2.解釋


官網位置 DataSet1.6出現的
SchemaRDD < 1.3    1.3版本前叫 SchemaRDD   1.3以後 叫DataFrame 
DataSet支援 Scala , JAVA 不支援python
DataFrame 支援四種 JAVA,Scala.Python,R
DataFrame:並不是spark sql獨創的，原來就有的，從其他框架借鑑過來的

二.DataFrame 注意事項

1.注意


分散式的資料集
按列進行組織的
就是等於關係型資料庫總的一張表
DataFrame=DataSet[Row] 型別是Row

三.DataFram 與RDD的區別

1.定義層面


RDD定義裡面有泛型 RDD[person ]  RDD不知道Person裡面有什麼的
DataFrame  不一樣 ，裡面是張表，所以暴露的資訊多

2.底層方面


RDD開發各種語言有各自的執行環境，所以效能不一樣，差異很大，但是DataFrame 是統一都經
過計劃，在執行，不用管語言開發，效能差不多

3.API方面


DataFrame   比RDD 更加豐富

三.其餘注意事項

1.注意點


Spark SQL入口點   2.0版本
    <2: SQLContext   HiveContext
    >=2: SparkSession
spark-shell  啟動會預設啟動sc，spark 兩個  SparkContext,SparkSession
spark.read.json() 不推薦
可以這樣寫
   spark.read.format("json").load(path)    
   spark.read.format("text").load(path)

2.支援hive模式程式碼


  val spark = SparkSession.builder()
      .appName("Test")
      .master("local[2]")
      .enableHiveSupport() //支援hive
      .getOrCreate()

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69941978/viewspace-2653164/，如需轉載，請註明出處，否則將追究法律責任。

Spark SQL 教程：通過示例瞭解 Spark SQL
2021-12-29
SparkSQL
Spark SQL 教程：透過示例瞭解 Spark SQL
2021-12-29
SparkSQL
Spark SQL:4.對Spark SQL的理解
2018-12-08
SparkSQL
Spark系列 - (3) Spark SQL
2023-02-23
SparkSQL
Apache Kyuubi 助力 CDH 解鎖 Spark SQL
2021-11-18
ApacheSparkSQL
官宣！.NET官網釋出中⽂版
2021-12-16
spark學習筆記--Spark SQL
2018-07-13
Spark筆記SQL
Cris 的 Spark SQL 筆記
2018-12-30
SparkSQL筆記
Spark SQL 欄位血緣在 vivo 網際網路的實踐
2022-04-25
SparkSQL
Spark SQL中出現 CROSS JOIN 問題解決
2019-10-13
SparkSQLROS
Spark SQL | Spark，從入門到精通
2019-01-21
SparkSQL
spark2.2.0 配置spark sql 操作hive
2018-09-23
SparkSQLHive
Spark 系列（九）—— Spark SQL 之 Structured API
2019-08-13
SparkSQLStructAPI
Spark 原始碼系列（九）Spark SQL 初體驗之解析過程詳解
2019-04-25
Spark原始碼SQL
Hive on Spark和Spark sql on Hive，你能分的清楚麼
2022-01-04
HiveSparkSQL
Hive on Spark 和 Spark sql on Hive，你能分的清楚麼
2022-09-26
HiveSparkSQL
Spark SQL | 目前Spark社群最活躍的元件之一
2020-11-24
SparkSQL元件
幽默：SQL Join形象解釋
2024-05-19
SQL
Spark API 全集(1):Spark SQL Dataset & DataFrame API
2018-12-09
SparkAPISQL
Spark 系列（十一）—— Spark SQL 聚合函式 Aggregations
2019-08-14
SparkSQL函式
Spark Streaming + Spark SQL 實現配置化ET
2021-09-09
SparkSQL
spark sql 實踐（續）
2018-07-08
SparkSQL
Spark SQL：通用的load和save操作
2018-09-26
SparkSQL
15、Spark Sql（一），生成DataFrame的方式
2018-03-04
SparkSQL
Spark SQL 開窗函式
2020-03-23
SparkSQL函式
Flume+Spark+Hive+Spark SQL離線分析系統
2018-09-18
SparkHiveSQL
Spark 從零到開發（五）初識Spark SQL
2021-09-09
SparkSQL
Spark SQL中的RDD與DataFrame轉換
2019-08-12
SparkSQL
Solon 1.6.10 重要釋出，現在有官網嘍！
2021-12-24
Spark SQL學習——DataFrame和DataSet
2019-04-04
SparkSQL
Spark SQL,正則,regexp_replace
2018-06-03
SparkSQL
Spark SQL如何選擇join策略
2021-01-29
SparkSQL
不能進入GitHub官網的解決辦法
2020-10-26
Github
【Spark篇】---Spark故障解決（troubleshooting）
2018-03-04
Spark
詳解 Spark 中的 Bucketing
2020-05-15
Spark
為什麼說Spark SQL遠遠超越了MPP SQL
2021-09-09
SparkSQL
Apache Spark SQL的高階Join連線技術
2019-01-08
ApacheSparkSQL
Spark SQL中列轉行（UNPIVOT）的兩種方法
2019-01-23
SparkSQL

Spark SQL的官網解釋

一.官網位置

1.位置

2.解釋

二.DataFrame 注意事項

1.注意

三.DataFram 與RDD的區別

1.定義層面

2.底層方面

3.API方面

三.其餘注意事項

1.注意點

2.支援hive模式程式碼

相關文章