Spark Standalone模式 Master程式掛掉問題
環境:
spark version :1.5.2
執行模式:standalone
過程分析:
叢集上跑著大量任務,但發現叢集每執行兩天就會掛掉一次。掛掉後叢集所有work程式和master程式都會死掉。於是檢視work程式日誌:
於是再檢視Master程式日誌發現報OOM:
java.lang.OutOfMemoryError: GC overhead limit execeeded
由於讀過Storage模組原始碼,得知快取資料和Master程式無關。於是透過jstat工具監控了一下Master程式,發現每當任務執行完關閉後,
Master程式的jvm老年代佔用會直線飆高。無意間想到會不會和日誌記錄有關,查了一下果然,Spark的History預設會將50個執行完的application
的一些資訊(ui介面要顯示的內容)載入到Master程式中,由於我們的任務複雜度高,有些任務的日誌已經達到150M,這些大資料會直接被
載入到jvm老年代中,當老年代撐滿,執行多次full gc後也釋放不掉,所有就報了GC overhead limit execeeded異常。
解決方案:
由於我們叢集記憶體資源有限,已不可能再加大Master程式記憶體大小,所以只能考慮透過配置來解決
查詢了一下文件發現有一個配置項:spark.history.retainedApplications 該引數會控制載入在記憶體中的application日誌數量。 但是透過
配置該配置項發現記憶體還是會gc不掉,不知算不算是BUG。再查文件發現了另一個配置項:spark.deploy.retainedApplications 該配置項是控制
ui頁面上顯示的歷史application數量。在spark-env.sh 中增加 :export SPARK_MASTER_OPTS="-Dspark.deploy.retainedApplications=5" 再次監控
jvm發現當老年代撐滿後會執行一次full gc釋放掉記憶體,至此,問題解決。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29754888/viewspace-2063153/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Spark開發-Standalone模式Spark模式
- Spark Standalone模式 高可用部署Spark模式
- 【Spark篇】--Spark中Standalone的兩種提交模式Spark模式
- 部署spark2.2叢集(standalone模式)Spark模式
- 深入理解Spark 2.1 Core (五):Standalone模式Spark模式
- Windows上搭建Standalone模式的Spark環境Windows模式Spark
- 關於MASTER=spark://SparkMaster:7077 ./spark-shell問題ASTSpark
- spark 2.1.0 standalone模式配置&&打包jar包透過spark-submit提交Spark模式JARMIT
- WebSocket 服務掛掉問題記錄Web
- spark之 spark 2.2.0 Standalone安裝、wordCount演示Spark
- (轉)hbase master掛掉-zookeeper連線超時原因AST
- Spark master standalongSparkAST
- 掛機掉線是代理IP的問題嗎?
- No known master node問題AST
- Spark —— Spark OOM Error問題排查定位SparkOOMError
- linux 檢視程式掛掉資訊Linux
- Mongodb的master-slave模式與master-master模式實驗MongoDBAST模式
- standalone執行模式下 應用模式作業部署模式
- Spark學習——問題排查Spark
- spark core原始碼分析3 Master HASpark原始碼AST
- Spark 叢集搭建從零開始之3 Spark Standalone叢集安裝、配置與測試Spark
- Master-Worker 模式AST模式
- Master-Worker模式AST模式
- 【Spark篇】---Spark解決資料傾斜問題Spark
- 蘋果代簽名掉籤問題蘋果
- Spark面試題(七)——Spark程式開發調優Spark面試題
- 使用maven-shade-plugin外掛解決spark依賴衝突問題MavenPluginSpark
- 【Spark篇】---Spark中Master-HA和historyServer的搭建和應用SparkASTServer
- PHP 併發程式設計之 Master-Worker 模式PHP程式設計AST模式
- html檔案中的php程式碼被註釋掉的問題HTMLPHP
- 【scala】問題cannot resolve symbol sparkSymbolSpark
- spark core原始碼分析2 master啟動流程Spark原始碼AST
- 外掛失效問題
- Zookeeper原始碼分析(三) ----- 單機模式(standalone)執行原始碼模式
- rocketMq叢集master模式搭建MQAST模式
- 系統中沒有郵件客戶端設定autoLink=email會掛掉的問題客戶端AI
- Spark任務OOM問題如何解決?SparkOOM
- 單例模式和多例模式問題得一個問題!單例模式