Trino Master OOM 排查記錄

meicanhong發表於2023-03-13

原文網址 : https://www.cnblogs.com/meicanhong/p/17211059.html

背景

最近線上的 trino 叢集 master 節點老是因為 OOM crash，我們注意到 trino crash 前叢集正在執行的查詢數量正常，不太像是因為併發查詢資料太多導致的 OOM。遂配置 trino master 的 jvm，使其在崩潰後生成一份 dump 檔案，方便我們進行問題排查。

排查問題過程

收集到了 Trino master oom dump 檔案，用 mat 工具對其分析得出報告。
從報告得知，trino master crash 前有一條查詢消耗掉了大量資源，還有一大堆的 DeleteFileIndex 例項也消耗掉很多資源。

我們有收集 trino 上所有的查詢語句，透過 query_id 定位到那條異常 SQL。初看 SQL 邏輯，沒太大問題，應該不會導致 trino master oom。
於是找一個 trino 叢集做故障還原，發現併發執行異常SQL 4條，master 就會 crash。
於是進 trino-master 容器內，用 arthas 實時觀察 jvm 狀況。
發現當異常SQL 發起查詢時，jvm 內 iceberg-work-pool 執行緒的 cpu 暫用率會飆升到 100%，且此時 jvm 記憶體也在飆升，過程持續 20s，剛好是異常SQL 生成執行計劃所花費的時間。

然後使用 arthas 檢視 iceberg-work-pool 執行緒在幹嘛？發現其在呼叫 DeleteFileIndex 這個類，在報告裡面也是屬於 top 10 comsumer 。

看棧資訊，得到資訊在掃描 iceberg 的 manifestlist 時，會去掃描已刪除的檔案。猜測大機率是需要找到已刪除的資料和現在存在的資料做一個 merge，才是當前快照的真實資料。

於是分析懷疑表 nft_orders_v2 的後設資料資訊，發現 snapshow 裡需要讀取大量的刪除檔案。

snapshots

而 Trino 是使用 merge on read 模式進行 merge/update/delete 操作的，這樣的話每次查詢時，得掃描 "delete file" 來和 "data file" 進行合併，得出真實資料。

所以問題就出現在這，由於該表每半小時生產一次，底層存在大量的 'delete file' ，每次查詢時都要掃描這些 'delete file' 然後做 merge 操作生成執行計劃。這步操作消耗掉很多 cpu資源和記憶體資源，導致 trino master 節點崩潰。

解決方案

使用 trino 的小檔案合併功能，重寫底層資料檔案即可修復。

ALTER TABLE nft_orders_v2 EXECUTE optimize (file_size_threshold => '100MB')

為了規避此類問題再次分析，還需要找出哪些查詢的查詢計劃時間大於 10s，找出這些查詢並分析用到的表的後設資料是否合理，不合理要及時修正。

Kubernetes Pod OOM 排查日記
2020-08-07
OOM
記錄一次線上OOM情況排查過程
2018-05-17
OOM
記一次oom問題排查
2022-01-23
OOM
記一次OOM問題排查過程
2019-11-22
OOM
tikv oom排查過程
2022-08-07
OOM
記一次 K3s MySQL 啟動 OOM 排查
2019-09-29
MySqlOOM
Spark —— Spark OOM Error問題排查定位
2020-11-22
SparkOOMError
記錄一次木馬排查
2022-02-12
記錄一次問題排查
2021-08-02
一次生產環境OOM排查
2024-03-01
OOM
Mysql Master-slave複製簡單配置記錄
2018-06-19
MySqlAST
docker無法啟動排查運維記錄
2024-09-22
Docker運維
記錄一次記憶體洩漏排查過程
2023-11-06
記憶體
fastdfs資料遷移以及fastdfs問題排查記錄
2021-03-01
AST
trino容器安裝
2024-06-15
JVM讀書筆記之OOM
2018-09-11
JVM筆記OOM
ssts-hospital-web-master專案實戰記錄二：版本管理-git
2024-10-23
WebASTGit
ssts-hospital-web-master專案實戰記錄七：核心架構
2024-10-24
WebAST架構
記錄GitHub使用過程中的 error: src refspec master does not match any
2021-04-02
GithubErrorAST
記錄一次Flink作業異常的排查過程
2020-06-17
danthelion/trino-minio-iceberg-example：使用Minio、Trino、iceberg搭建資料工程演示案例
2022-07-19
MySQL OOM 系列一 Linux記憶體分配
2021-09-09
MySqlOOMLinux記憶體
JVM-記憶體區域與OOM
2021-11-04
JVM記憶體OOM
記錄一次排查解決伺服器卡死的過程
2024-07-12
伺服器
記錄一次資料庫CPU被打滿的排查過程
2022-08-31
資料庫
記錄一次K8s pod被殺的排查過程
2024-01-05
K8S
容器網路防火牆狀態異常導致丟包排查記錄
2020-09-03
防火牆
從應用層到網路層排查 Dubbo 介面超時全記錄
2021-04-20
Redis連線超時排查實錄
2024-04-03
Redis
jenkins slave節點上的job構建記錄都只會在master伺服器
2024-06-17
JenkinsAST伺服器
排查 k8s 叢集 master 節點無法正常工作的問題
2020-01-07
K8SAST
記錄一次排查log4cxx庫按照日期回滾，不建立新目錄的BUG
2023-02-07
! [rejected] master -> master (fetch first)
2020-08-30
AST
Trino 436 - 使用教程（親測，詳細）
2024-12-10
「前端 BUG 錄」遇到BUG應該如何排查
2023-03-30
前端
記錄一個HttpClient超時連線配置不生效的問題排查過程
2024-04-26
HTTPclient
inmemory OOM了
2022-11-17
OOM
OOM（Out Of Memory）
2020-12-31
OOM

Trino Master OOM 排查記錄

背景

排查問題過程

解決方案

相關文章