一次線上JVM記憶體異常排查 -- 物件之間的複製

王翱_奧利奧發表於2019-02-14

原文網址 : https://juejin.im/post/5c651ab051882562ed512a95

JVM記憶體物件

1、現象

2月11日閘道器在短時間內出現20+的訪問出錯，檢視kibina如下：

根據trace得到具體的堆疊異常，發現都是負載均衡同一個pod均顯示連線異常：

去grafana檢視該pod執行情況，可以發現記憶體突然下降的情況，同時該pod已經達到記憶體上限（8G），當資源申請不到的情況下，該pod可能存在重啟的情況：

檢視ad服務的日誌驗證了當時確實發生了重啟：

此時可以基本定位到因為記憶體問題使得服務重啟，從而閘道器無法負載均衡到該服務例項導致閘道器報錯，接下來需要明確是什麼原因讓該pod的記憶體佔用如此之高。

二、記憶體問題定位

根據grafana的圖表，可以看出堆記憶體比較正常，而非堆記憶體出現了異常（使用率超過100%）：

非堆就是JVM留給自己用的，方法區、JVM內部處理或優化所需的記憶體(如JIT編譯後的程式碼快取)、每個類結構(如執行時常數池、欄位和方法資料)以及方法和構造方法的程式碼都在非堆記憶體中。

用JProfiler開啟該檔案（也可以用jVisualVM），找到Biggest Objects，然後發現在存活物件中存在大量的AdDto這個類的例項，大量這些物件整整佔用了1G多：

三、程式碼檢查

回到程式碼中，檢查AdDto的生成方式，發現用瞭如下的操作：

modelMapper每一次呼叫addMapping都將建立一份該類的結構（通過位元組碼然後由類載入器載入），查閱官網相關文件。如果轉換型別確定，應該將ModelMapper設定成單例（modelmapper.org/user-manual…

四、線下重現

在普通介面中用這段程式碼驗證猜想，可以很明顯看到非堆記憶體一路猛漲，並且載入類的數量也在一路上升，基本證實了問題：

五、修復並驗證

將程式碼改成如下形式並重新壓測：

    private static ModelMapper modelMapper;

    static {
        modelMapper = new ModelMapper();
        TypeMap<Person, PersonDTO> typeMap = modelMapper.createTypeMap(Person.class, PersonDTO.class);
        typeMap.addMappings(mapper -> {
            mapper.skip(PersonDTO::setAge);
        });
    }

    @GetMapping("api/benchmark/qa")
    public PersonDTO qa() {
        Person p = new Person();
        p.setName("wangao");
        p.setAge(30);
        return modelMapper.map(p, PersonDTO.class);
    }
複製程式碼

發現非堆記憶體穩定，類載入數量穩定：

一次django記憶體異常排查
2020-07-30
Django記憶體
異常連線導致的記憶體洩漏排查
2019-08-03
記憶體
JVM 常見線上問題 → CPU 100%、記憶體洩露問題排查
2020-10-09
JVM記憶體洩露
線上排查：記憶體異常使用導致full gc頻繁
2023-02-07
記憶體GC
一次JVM記憶體問題導致的線上事故
2020-05-14
JVM記憶體
JVM(2)-Java記憶體區域與記憶體溢位異常
2019-03-22
JVMJava記憶體溢位
一次尋常的堆外記憶體洩漏排查
2020-11-01
記憶體
記一次線上SpringCloud-Feign請求服務超時異常排查
2022-01-13
SpringGCCloud
一次排查線上介面偶發異常耗時引起的思考！
2020-07-11
一次線上Redis類轉換異常排查引發的思考
2019-06-24
Redis
JVM -- 物件的記憶體佈局
2020-10-25
JVM物件記憶體
JVM堆外記憶體問題排查
2018-07-15
JVM記憶體
物件的生存期記憶體深度複製複製建構函式筆記
2024-07-14
物件記憶體函式筆記
Java記憶體區域與記憶體溢位異常（JVM學習系列1）
2018-07-30
Java記憶體溢位JVM
JVM學習-02-Java記憶體區域與記憶體溢位異常
2024-12-01
JVMJava記憶體溢位
記一次棧溢位異常問題的排查
2024-04-16
記一次隱藏很深的 JVM 線上慘案的分析、排查、解決！
2022-12-08
JVM
一次 Java 記憶體洩漏的排查
2020-03-15
Java記憶體
JVM-物件及物件記憶體佈局
2021-03-05
JVM物件記憶體
深入理解 Python 的物件複製和記憶體佈局
2022-12-16
Python物件記憶體
記錄一次Flink作業異常的排查過程
2020-06-17
JVM記憶體分為3個記憶體空間
2021-03-01
JVM記憶體
luajit表記錄監控（憶一次專案上線中遇到的luajit物件記憶體洩漏）
2018-12-26
物件記憶體
記一次訂單號重複的異常
2019-12-05
記一次"記憶體洩露"排查過程
2019-10-15
記憶體洩露
JVM記憶體結構、Java記憶體模型和Java物件模型
2019-06-22
JVM記憶體Java模型物件
【JVM故障問題排查心得】「記憶體診斷系列」JVM記憶體與Kubernetes中pod的記憶體、容器的記憶體不一致所引發的OOMKilled問題總結（上）
2022-11-29
JVM記憶體OOM
揭露 FileSystem 引起的線上 JVM 記憶體溢位問題
2024-04-26
JVM記憶體溢位
記一次線上FGC問題排查
2023-01-31
GC
GoldenGate異種資料庫之間的複製
2022-03-09
Go資料庫
JAVA記憶體區域與記憶體溢位異常
2018-09-28
Java記憶體溢位
Java常見知識點彙總（⑱）——Jvm記憶體結構、Java記憶體模型、Java物件模型的區別
2020-03-16
JavaJVM記憶體模型物件
記錄一次記憶體洩漏排查過程
2023-11-06
記憶體
JVM之物件的建立、記憶體佈局、訪問走位總結
2019-03-13
JVM物件記憶體
記一次 Ruby 記憶體洩漏的排查和修復
2019-04-03
記憶體
記一次使用windbg排查記憶體洩漏的過程
2020-05-31
記憶體
Java的記憶體 -JVM 記憶體管理
2018-08-20
Java記憶體JVM
介面超時日誌排查分析-BeanUtils物件複製6秒及型別不一致複製異常,複製null屬性被覆蓋解決,常見Bean複製框架的效能對比
2024-12-09
Bean物件型別Null框架

一次線上JVM記憶體異常排查 -- 物件之間的複製

1、現象

二、記憶體問題定位

三、程式碼檢查

四、線下重現

五、修復並驗證

相關文章