Spark效能優化：診斷記憶體的消耗

豐澤發表於2018-09-13

原文網址 : https://juejin.im/post/5b9a2482e51d450e81087f36

一、記憶體都花費在哪裡了？

1、每個Java物件，都有一個物件頭，會佔用16個位元組，主要是包括了一些物件的元資訊，比如指向它的類的指標。如果一個物件本身很小，比如就包括了一個int型別的field，那麼它的物件頭實際上比物件自己還要大。

2、Java的String物件，會比它內部的原始資料，要多出40個位元組。因為它內部使用char陣列來儲存內部的字元序列的，並且還得儲存諸如陣列長度之類的資訊。而且因為String使用的是UTF-16編碼，所以每個字元會佔用2個位元組。比如，包含10個字元的String，會佔用60個位元組。

3、Java中的集合型別，比如HashMap和LinkedList，內部使用的是連結串列資料結構，所以對連結串列中的每一個資料，都使用了Entry物件來包裝。Entry物件不光有物件頭，還有指向下一個Entry的指標，通常佔用8個位元組。

4、元素型別為原始資料型別（比如int）的集合，內部通常會使用原始資料型別的包裝型別，比如Integer，來儲存元素。

二、如何判斷你的程式消耗了多少記憶體？

1、首先，自己設定RDD的並行度，有兩種方式：要不然，在parallelize()、textFile()等方法中，傳入第二個引數，設定RDD的task / partition的數量；要不然，用SparkConf.set()方法，設定一個引數，spark.default.parallelism，可以統一設定這個application所有RDD的partition數量。

2、其次，在程式中將RDD cache到記憶體中，呼叫RDD.cache()方法即可。

3、最後，觀察Driver的log，你會發現類似於：“INFO BlockManagerMasterActor: Added rdd_0_1 in memory on mbk.local:50311 (size: 717.5 KB, free: 332.3 MB)”的日誌資訊。這就顯示了每個partition佔用了多少記憶體。

4、將這個記憶體資訊乘以partition數量，即可得出RDD的記憶體佔用量。

Android效能優化篇之記憶體優化--記憶體洩漏
2018-06-04
Android優化記憶體
Android 效能優化之記憶體優化
2018-05-21
Android優化記憶體
一招教你成為大內密探：診斷優化找出消耗CPU效能的內鬼
2018-11-12
優化
iOS 使用Instruments優化記憶體效能
2019-04-04
iOS優化記憶體
Linux 效能優化之記憶體篇
2020-06-30
Linux優化記憶體
Part II 診斷和優化資料庫效能
2020-04-27
優化資料庫
Redis記憶體——記憶體消耗(記憶體都去哪了？)
2021-05-20
Redis記憶體
android效能評測與優化-記憶體
2019-04-12
Android優化記憶體
Spark效能優化
2022-04-09
Spark優化
[平臺建設] Spark任務的診斷調優
2021-12-31
Spark
Linux效能優化實戰記憶體篇（五）
2022-03-18
Linux優化記憶體
Linux效能優化：記憶體使用情況分析
2021-04-01
Linux優化記憶體
Android深度效能優化--記憶體優化（一篇就夠）
2020-03-05
Android優化記憶體
效能優化-記憶體池的設計和實現
2021-12-02
優化記憶體
spark效能優化（一）
2021-10-17
Spark優化
Android效能優化，Startalk會話頁GIF記憶體優化實踐
2019-02-19
Android優化會話記憶體
效能優化——記憶體洩漏（1）入門篇
2019-02-16
優化記憶體
Android記憶體優化
2018-03-24
Android記憶體優化
OpenResty 和 Nginx 的共享記憶體區是如何消耗實體記憶體的
2020-08-25
RESTNginx記憶體
Android效能優化：手把手帶你全面實現記憶體優化
2018-05-08
Android優化記憶體
關於redis記憶體分析，記憶體優化
2020-05-16
Redis記憶體優化
記憶體洩漏與排查流程——安卓效能優化
2019-01-07
記憶體安卓優化
iOS效能優化 - 工具Instruments之Leaks記憶體洩漏
2018-08-01
iOS優化記憶體
效能優化 | Go Ballast 讓記憶體控制更加絲滑
2021-11-17
優化GoAST記憶體
JVM效能調優，記憶體分析工具
2023-02-11
JVM記憶體
記憶體優化相關
2019-07-23
記憶體優化
Android Note - 記憶體優化
2019-05-01
Android記憶體優化
1.記憶體優化（一）記憶體洩漏
2019-02-11
記憶體優化
Spark效能優化：優化資料結構
2018-09-13
Spark優化資料結構
直播分享| 騰訊雲 MongoDB 智慧診斷及效能優化實踐
2022-06-23
MongoDB優化
hive on spark記憶體模型
2024-04-16
HiveSpark記憶體模型
實踐App記憶體優化：如何有序地做記憶體分析與優化
2019-03-04
APP記憶體優化
ABAP Memory Inspector 裡對動態記憶體物件的記憶體消耗度量方式
2023-01-16
記憶體物件
Android記憶體優化之圖片優化
2019-03-03
Android記憶體優化
Spark（十三） Spark效能調優之RDD持久化
2019-01-15
Spark持久化
[20210803]對比transparent hugepage的記憶體消耗.txt
2021-08-03
記憶體
win10怎麼優化記憶體 win10系統記憶體優化的方法
2022-01-24
Win10優化記憶體
spark效能優化幾點注意
2019-07-25
Spark優化

Spark效能優化：診斷記憶體的消耗

一、記憶體都花費在哪裡了？

二、如何判斷你的程式消耗了多少記憶體？

相關文章