Spark SQL的官網解釋
一.官網位置
1.位置
2.解釋
官網位置 DataSet1.6出現的
SchemaRDD < 1.3 1.3版本前叫 SchemaRDD 1.3以後 叫DataFrame
DataSet支援 Scala , JAVA 不支援python
DataFrame 支援四種 JAVA,Scala.Python,R
DataFrame:並不是spark sql獨創的,原來就有的,從其他框架借鑑過來的
二.DataFrame 注意事項
1.注意
分散式的資料集
按列進行組織的
就是等於關係型資料庫總的一張表
DataFrame=DataSet[Row] 型別是Row
三.DataFram 與RDD的區別
1.定義層面
RDD定義裡面有泛型 RDD[person ] RDD不知道Person裡面有什麼的
DataFrame 不一樣 ,裡面是張表,所以暴露的資訊多
2.底層方面
RDD開發各種語言有各自的執行環境,所以效能不一樣,差異很大,但是DataFrame 是統一都經
過計劃,在執行,不用管語言開發,效能差不多
3.API方面
DataFrame 比RDD 更加豐富
三.其餘注意事項
1.注意點
Spark SQL入口點 2.0版本
<2: SQLContext HiveContext
>=2: SparkSession
spark-shell 啟動會預設啟動sc,spark 兩個 SparkContext,SparkSession
spark.read.json() 不推薦
可以這樣寫
spark.read.format("json").load(path)
spark.read.format("text").load(path)
2.支援hive模式程式碼
val spark = SparkSession.builder()
.appName("Test")
.master("local[2]")
.enableHiveSupport() //支援hive
.getOrCreate()
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69941978/viewspace-2653164/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Spark SQL 教程: 通過示例瞭解 Spark SQLSparkSQL
- Spark SQL 教程: 透過示例瞭解 Spark SQLSparkSQL
- Spark SQL:4.對Spark SQL的理解SparkSQL
- Spark系列 - (3) Spark SQLSparkSQL
- Apache Kyuubi 助力 CDH 解鎖 Spark SQLApacheSparkSQL
- 官宣!.NET官網釋出中⽂版
- spark學習筆記--Spark SQLSpark筆記SQL
- Cris 的 Spark SQL 筆記SparkSQL筆記
- Spark SQL 欄位血緣在 vivo 網際網路的實踐SparkSQL
- Spark SQL中出現 CROSS JOIN 問題解決SparkSQLROS
- Spark 系列(九)—— Spark SQL 之 Structured APISparkSQLStructAPI
- Spark SQL | Spark,從入門到精通SparkSQL
- spark2.2.0 配置spark sql 操作hiveSparkSQLHive
- Spark 原始碼系列(九)Spark SQL 初體驗之解析過程詳解Spark原始碼SQL
- Hive on Spark 和 Spark sql on Hive,你能分的清楚麼HiveSparkSQL
- Hive on Spark和Spark sql on Hive,你能分的清楚麼HiveSparkSQL
- Spark SQL | 目前Spark社群最活躍的元件之一SparkSQL元件
- 幽默:SQL Join形象解釋SQL
- Spark Streaming + Spark SQL 實現配置化ETSparkSQL
- Spark 系列(十一)—— Spark SQL 聚合函式 AggregationsSparkSQL函式
- Spark API 全集(1):Spark SQL Dataset & DataFrame APISparkAPISQL
- spark sql 實踐(續)SparkSQL
- Spark SQL:通用的load和save操作SparkSQL
- 15、Spark Sql(一),生成DataFrame的方式SparkSQL
- Spark SQL 開窗函式SparkSQL函式
- Spark 從零到開發(五)初識Spark SQLSparkSQL
- Flume+Spark+Hive+Spark SQL離線分析系統SparkHiveSQL
- Spark SQL中的RDD與DataFrame轉換SparkSQL
- Solon 1.6.10 重要釋出,現在有官網嘍!
- Spark SQL如何選擇join策略SparkSQL
- Spark SQL學習——DataFrame和DataSetSparkSQL
- Spark SQL,正則,regexp_replaceSparkSQL
- 不能進入GitHub官網的解決辦法Github
- 【Spark篇】---Spark故障解決(troubleshooting)Spark
- 為什麼說Spark SQL遠遠超越了MPP SQLSparkSQL
- 詳解 Spark 中的 BucketingSpark
- Apache Spark SQL的高階Join連線技術ApacheSparkSQL
- Spark SQL中列轉行(UNPIVOT)的兩種方法SparkSQL