spark筆記

東東的學習筆記666發表於2020-11-20

原文網址 : https://blog.csdn.net/qq_39884410/article/details/109832292

序列化
driver executor
bypartition 按分割槽傳輸資料
flatmap拆成一個個
當記憶體較大時建議使用mapPartion(),提供效率，減少網開銷
glom 將一個分割槽的資料放到一個陣列中（場景：每個分割槽取最大值）
groupby運算元，根據結果分組
filter根據規則分組
spark中所有的轉換運算元沒有shuffle的運算元，效能比較快
初始值
shuffle 寬依賴
只要有shuffle存在，只有在parentRDD處理完成後，才開始接下來的計算
寬依賴是劃分stage的依據

spark學習筆記--Spark SQL
2018-07-13
Spark筆記SQL
spark學習筆記-- Spark Streaming
2018-08-03
Spark筆記
Spark學習筆記（三）-Spark Streaming
2020-06-24
Spark筆記
Spark簡明筆記
2018-11-24
Spark筆記
spark學習筆記
2020-11-01
Spark筆記
spark學習筆記--RDD
2018-07-05
Spark筆記
Cris 的 Spark SQL 筆記
2018-12-30
SparkSQL筆記
Cris 的 Spark Streaming 筆記
2019-01-01
Spark筆記
spark學習筆記--叢集執行Spark
2018-07-12
Spark筆記
spark學習筆記--Spark調優與除錯
2018-07-12
Spark筆記除錯
【spark筆記】在idea用maven匯入spark原始碼
2021-09-09
Spark筆記IdeaMaven原始碼
spark學習筆記--RDD鍵對操作
2018-07-06
Spark筆記
spark學習筆記--進階程式設計
2018-07-09
Spark筆記程式設計
寫一個Spark DataSource的隨手筆記
2021-09-09
Spark筆記
Spark記錄（一）：Spark全景概述
2021-11-06
Spark
spark學習筆記--資料讀取與儲存
2018-07-09
Spark筆記
spark2.4.3 sparkSQL 使用者自定義函式筆記
2019-05-21
SparkSQL函式筆記
Spark記錄（二）：Spark程式的生命週期
2021-11-07
Spark
極光筆記丨Spark SQL 在極光的建設實踐
2021-11-09
筆記SparkSQL
spark 原始碼分析之十五 -- Spark記憶體管理剖析
2019-07-17
Spark原始碼記憶體
hive on spark記憶體模型
2024-04-16
HiveSpark記憶體模型
spark 原始碼分析之十六 -- Spark記憶體儲存剖析
2019-07-18
Spark原始碼記憶體
Spark學習——記憶體管理
2019-04-02
Spark記憶體
印象筆記 --- 方法分享筆記
2018-11-22
筆記
好程式設計師大資料教程分享Spark快速入門（72集影片+原始碼+筆記）
2019-11-23
程式設計師大資料Spark原始碼筆記
筆記
2020-12-28
筆記
Spark之spark shell
2018-09-13
Spark
Spark 雜記1-專案使用經驗
2018-09-01
Spark
Spark 環境問題記錄和解決方法
2020-07-03
Spark
微軟外服札記④——Spark中的那些坑...
2023-02-01
微軟Spark
Spark中的記憶體計算是什麼?
2021-06-26
Spark記憶體
Spark on Yarn 和Spark on Mesos
2018-11-20
SparkYarn
Spark系列 - (3) Spark SQL
2023-02-23
SparkSQL
docker 筆記
2024-09-10
Docker筆記
hybrid筆記
2019-03-20
筆記
Meteor筆記
2019-03-01
筆記
String筆記
2019-02-16
筆記
html 筆記
2019-02-16
HTML筆記

spark筆記

相關文章