Spark設定executor-memory後，executor顯示的記憶體不符問題

aminor發表於2024-04-23

原文網址 : https://www.cnblogs.com/aminor/p/18152647

以該命令為例，我們設定一個executor並分配記憶體為2800m，可以看到ui上只給executor分配了1.5G的記憶體。同理，如果你設定了--executor-memory=1g，那麼實際上只會有1048.8M的記憶體會被分配。


spark-submit --master yarn \
--num-executors=1 \
--executor-memory=2800m \
--class org.apache.spark.examples.SparkPi \
/opt/module/spark-3.5.1-bin-hadoop3/examples/jars/spark-examples_2.12-3.5.1.jar 1000

這個問題是因為顯示的記憶體為，(heap space - 300MB) * spark.memory.fraction所劃分的記憶體。詳細介紹參見文件 https://spark.apache.org/docs/latest/tuning.html#memory-management-overview

記憶體管理概覽

在 Spark 中，記憶體使用主要分為兩大類：執行記憶體和儲存記憶體。執行記憶體用於計算處理，如 shuffles（洗牌）、joins（連線）、sorts（排序）和 aggregations（聚合）；而儲存記憶體則用於快取和在叢集中傳播內部資料。在 Spark 中，執行記憶體和儲存記憶體共享一個統一的區域（M）。當沒有使用執行記憶體時，儲存記憶體可以佔用所有可用的記憶體，反之亦然。在必要時，執行記憶體可以驅逐儲存記憶體，但只到儲存記憶體的使用量降到某個閾值（R）以下。換句話說，R 描述了 M 中的一個子區域，在該區域內，快取的資料塊不會被驅逐。由於實現機制的複雜性，儲存記憶體不能驅逐執行記憶體。

此設計確保了幾項理想的特性。首先，不利用快取的應用可以使用全部記憶體空間進行執行操作，避免不必要的磁碟溢位。其次，利用快取的應用可以預留一定的儲存空間（R），確保其資料塊不會被驅逐。最後，這種方法為多種工作負載提供了合理的即插即用效能，而無需使用者深入瞭解內部記憶體劃分的細節。

儘管有兩個相關的配置引數，但典型使用者通常不需要調整它們，因為預設值已適用於大多數工作負載：

spark.memory.fraction 表示 M 佔用的比例，計算公式為 (JVM 堆空間 - 300MiB) 的百分比（預設值為 0.6）。其餘的空間（40%）留給使用者資料結構、Spark 的內部後設資料以及作為安全儲備，以防出現稀疏或異常大的記錄導致的 OOM（記憶體溢位）錯誤。
spark.memory.storageFraction 表示 R 佔 M 的比例（預設值為 0.5）。R 是 M 內部的一塊儲存區域，其內的快取資料塊不會被執行操作驅逐。

spark.memory.fraction 的值應該設定在能夠在 JVM 的老年代或“終身代”中舒適適應這部分堆空間。

設定spacevim字型顯示亂碼問題
2018-05-29
IE下記憶體增漲明顯的問題
2019-03-29
記憶體
iOS 解決設定rootViewController 記憶體不釋放問題
2020-02-06
iOSViewController記憶體
w10老顯示記憶體不足怎麼解決 w10記憶體總是顯示記憶體不足處理方法
2020-09-27
記憶體
排查Java的記憶體問題
2018-03-13
Java記憶體
hive on spark記憶體模型
2024-04-16
HiveSpark記憶體模型
oxyplot ScatterPoint新增後不顯示問題
2024-10-28
win10加記憶體條後需要設定嗎
2021-03-26
Win10記憶體
IC GX259FT 顯示器設定與問題/BUG
2024-06-28
SQLServer記憶體問題分析
2020-11-18
SQLServer記憶體
探究 iOS 記憶體問題
2022-12-30
iOS記憶體
Spark學習——記憶體管理
2019-04-02
Spark記憶體
eclipse中設定JVM記憶體
2018-05-07
EclipseJVM記憶體
JVM 堆記憶體設定原理
2018-03-03
JVM記憶體
linux 設定預留記憶體
2024-07-05
Linux記憶體
eclipse設定JVM記憶體堆
2022-10-21
EclipseJVM記憶體
設定SQLserver執行記憶體
2020-12-07
SQLServer記憶體
jvm記憶體設定及記憶體溢位、解決方案
2018-08-08
JVM記憶體溢位
顯示器設定
2024-03-30
win10記憶體顯示異常怎麼回事 win10系統記憶體顯示異常如何修復
2020-12-20
Win10記憶體
ThreadLocal記憶體洩漏問題
2018-09-25
thread記憶體
記憶體分配問題處理
2024-02-05
記憶體
解決golang 的記憶體碎片問題
2023-03-06
Golang記憶體
關於虛擬機器記憶體和JVM記憶體設定的思考
2024-04-16
虛擬機記憶體JVM
nvidia顯示設定不可用 nvidia沒有顯示設定
2022-07-05
Spark中的記憶體計算是什麼?
2021-06-26
Spark記憶體
project中的堆疊記憶體，記憶體地址引用，gc相關問題
2018-10-31
Project記憶體GC
Java記憶體模型FAQ（五）舊的記憶體模型有什麼問題？
2021-12-02
Java記憶體模型
Oracle的SCN顯示問題
2019-02-24
Oracle
Oracle：記憶體設定注意事項
2021-11-15
Oracle記憶體
macOS Monterey新問題：“記憶體洩漏”，應用後臺執行消耗上百 GB 記憶體
2021-11-03
Mac記憶體
怎麼設定虛擬記憶體win10 win10虛擬記憶體如何設定
2020-10-11
記憶體Win10
win10虛擬記憶體怎麼設定 win10虛擬記憶體設定方法
2022-04-30
Win10記憶體
告別記憶體OOM，解決MySQL記憶體增長問題
2024-06-04
記憶體OOMMySql
spark 原始碼分析之十五 -- Spark記憶體管理剖析
2019-07-17
Spark原始碼記憶體
win10電腦虛擬記憶體怎麼設定 win10虛擬記憶體設定的方法
2022-04-27
Win10記憶體
一個SMMU記憶體訪問異常的問題
2024-08-10
記憶體
關於PHP記憶體洩漏的問題
2021-01-21
PHP記憶體

Spark設定executor-memory後，executor顯示的記憶體不符問題

相關文章