core dump如何解決排查的過程

溪因發表於2024-08-22

原文網址 : https://www.cnblogs.com/rebecca2020/p/18374910

**Core dump** 是指程式在執行過程中發生嚴重錯誤，通常是由於非法操作（如訪問無效記憶體地址）導致程式崩潰，作業系統生成了一個包含程式狀態的記憶體映像檔案（core dump）。這個檔案可以用於除錯，幫助開發者找到問題的根源。解決和排查 core dump 的過程通常涉及以下幾個步驟：

### 1. **啟用 Core Dump**
- 在 Linux 系統中，core dump 通常預設是禁用的或限制大小。你可以使用以下命令啟用並配置 core dump 的生成：
```bash
ulimit -c unlimited # 取消 core dump 檔案大小的限制
```
- 設定 core dump 檔案的儲存路徑和命名格式：
```bash
sudo sysctl -w kernel.core_pattern=/path/to/core_%e_%p_%t
```
這裡 `%e` 表示程式名，`%p` 表示程序 ID，`%t` 表示時間戳。

### 2. **生成 Core Dump**
- 如果程式崩潰，它將生成一個 core dump 檔案（例如 `/path/to/core_myapp_12345_1615561027`）。
- 確保你有許可權訪問這個檔案，並且檔案不是空的。

### 3. **使用 GDB 除錯 Core Dump**
- 使用 GDB（GNU 偵錯程式）載入 core dump 檔案，以檢查程式崩潰時的狀態：
```bash
gdb /path/to/executable /path/to/core_dump_file
```
- 載入後，你可以使用 `bt`（backtrace）命令檢視崩潰時的呼叫堆疊：
```bash
(gdb) bt
```
- 透過呼叫堆疊，你可以檢視程式崩潰的具體位置，哪一行程式碼引發了錯誤，或者哪個函式出現了問題。

### 4. **檢查異常和訊號**
- 在 GDB 中，你可以使用 `info signals` 命令檢查導致 core dump 的訊號型別，例如 `SIGSEGV` 表示段錯誤，`SIGABRT` 表示程式呼叫 `abort()`。
- 結合訊號型別和 backtrace 資訊，定位出錯的原因。

### 5. **分析崩潰原因**
常見的崩潰原因包括：
- **空指標引用**: 程式嘗試訪問一個空指標指向的記憶體區域。
- **緩衝區溢位**: 寫入的資料超出了陣列或緩衝區的邊界。
- **非法記憶體訪問**: 嘗試訪問未分配或無權訪問的記憶體區域。
- **記憶體洩漏**: 長時間執行後，記憶體耗盡導致崩潰。

### 6. **解決問題**
- **修復程式碼**: 根據分析結果，修改相關程式碼，避免出現空指標、非法記憶體訪問等錯誤。
- **新增日誌**: 增加日誌記錄，特別是在可能發生崩潰的程式碼段周圍，以便未來更好地診斷問題。
- **使用工具檢測**: 使用 `valgrind` 等工具檢測記憶體問題，找出記憶體洩漏、無效記憶體訪問等問題。

### 7. **測試驗證**
- 修復問題後，重新編譯程式並進行全面測試，確保修復有效，且不會引入新的問題。
- 在真實環境中執行，並持續觀察，確保 core dump 不再發生。

### 8. **預防措施**
- **程式碼審查**: 定期進行程式碼審查，避免引入潛在的記憶體管理問題。
- **單元測試**: 編寫全面的單元測試，覆蓋可能的異常路徑。
- **靜態分析**: 使用靜態分析工具（如 `cppcheck` 或 `clang-tidy`）在編譯前檢測程式碼中的潛在錯誤。

透過這些步驟，開發者可以系統地排查和解決 core dump 問題，確保程式的穩定性和可靠性。

tikv oom排查過程
2022-08-07
OOM
一次線上問題的排查解決過程
2019-02-24
Linux core dump使用
2021-02-08
Linux
記錄一次排查解決伺服器卡死的過程
2024-07-12
伺服器
一次奇怪的的bug排查過程
2021-11-30
死鎖問題排查過程-間隙鎖的復現以及解決
2022-07-10
線上的一次fullgc排查過程
2024-07-03
GC
EF Core 遷移過程遇到EF Core tools version版本不相符的解決方案
2018-11-25
排查Mysql突然變慢的一次過程
2020-08-07
MySql
容器程式Core Dump處理
2019-03-07
java core dump分析實戰
2021-09-09
Java
一次線上介面超時的排查過程
2019-09-28
一次JVM GC長暫停的排查過程！
2023-04-06
JVMGC
一次JVM GC長暫停的排查過程
2023-01-12
JVMGC
記一次OOM問題排查過程
2019-11-22
OOM
一次FGC導致CPU飆高的排查過程
2020-06-01
GC
一次ygc越來越慢的問題排查過程
2019-03-14
GC
記一次記憶體溢位問題的排查、分析過程及解決思路
2020-09-20
記憶體溢位
一次透過dump檔案分析OutOfMemoryError異常程式碼定位過程
2024-05-06
Error
[貝聊科技]一個頁面阻塞問題的排查過程
2019-03-02
記錄一次Flink作業異常的排查過程
2020-06-17
解Bug之路-記一次儲存故障的排查過程
2020-10-14
記一次線上崩潰問題的排查過程
2021-11-10
記一次排查Flutter中預期外rebuild的過程
2021-06-01
FlutterRebuild
.net core web 啟動過程(4)-HostingEnvironment
2024-08-20
Web
.net core web 啟動過程(5)-HostBuilderContext
2024-08-20
WebUIContext
教育培訓app開發過程中有哪些難點？應如何解決？
2021-04-09
APP
記一次"記憶體洩露"排查過程
2019-10-15
記憶體洩露
一次IOS通知推送問題排查全過程
2022-05-04
iOS
ORA-07445: exception encountered: core dump [qervwRowProcedure()+133]
2019-04-06
Exception
gdb除錯core dump檔案之二
2024-07-29
除錯
一次排查Java專案記憶體洩漏的過程
2018-08-17
Java記憶體
記一次使用windbg排查記憶體洩漏的過程
2020-05-31
記憶體
記錄一次資料庫CPU被打滿的排查過程
2022-08-31
資料庫
如何解決過度擬合
2023-05-14
記錄一次線上OOM情況排查過程
2018-05-17
OOM
記錄一次記憶體洩漏排查過程
2023-11-06
記憶體
一次HIS系統卡頓原因排查過程分享
2022-10-18

core dump如何解決排查的過程

相關文章