【YashanDB知識庫】EXP導致主機卡死問題

YashanDB發表於2024-07-23

原文網址 : https://www.cnblogs.com/YashanDB/p/18317582

問題現象

問題單：exp匯出全庫1主2備主節點執行，DMP檔案30G左右系統卡死，發生主備切換

現象：

exp sys/Cod-2022 file=bim20240402.dmp full=y 伺服器卡死，ssh連線不上伺服器。
等待一兩個小時後，可以重新連線上。
備用節點升主正常，檢視run.log，心跳傳送不到主節點。
重連後，yasdb不在，檢視run.log沒有問題。未生成core檔案，yasagent程序等正常。

問題風險及影響

不能exp資料，資料遷移失敗

問題影響的版本

客戶測試環境版本：23.1.4.101

問題發生原因

exp匯出資料時，大量資料從磁碟放到data buff，導致實際使用記憶體增長，超過系統限定後，觸發oom導致yasdb被殺。

問題分析和處理過程

分析：

因為磁碟是nfs，初步懷疑是否是nfs導致網路問題。但換其它磁碟後，也出現同樣問題。
因為資料是從22.2.7.2使用exp匯出，imp匯入23.1。現在exp匯出出問題，懷疑是否是相容性問題。本地同樣方式操作，未復現成功。pstack檢視堆疊空間，gdb除錯顯示正常，也沒有core檔案生成。
檢視伺服器message資訊，發現yasdb都是被killed。懷疑是yasdb使用太多記憶體資源導致的問題，最終確認是這個原因。

檢視伺服器記憶體資源

free -h

檢視yasd buff情況

測試

在10.34.70.91節點：

嘗試如下：

● 開啟swap空間為20G，DATA_BUFFER_SIZE由23528M 改到10240M

exp sys/Cod-2022 file=bim20240402.dmp full=y 匯出成功，沒有異常狀態

● SWAP空間關閉。DATA_BUFFER_SIZE由23528M 改到10240M

exp sys/Cod-2022 file=bim20240402.dmp full=y 匯出成功，沒有異常狀態

● 開啟swap空間為40G。DATA_BUFFER_SIZE為23528M

exp sys/Cod-2022 file=bim20240402.dmp full=y 匯出成功，沒有異常狀態

● swap不開，DATA_BUFFER_SIZE為23528M

exp sys/Cod-2022 file=bim20240402.dmp full=y 伺服器卡死，直到yasdb被killed，才能重新連線上去

在10.34.70.78節點：

嘗試如下：

● swap空間為30G，

exp sys/Cod-2022 file=bim20240402.dmp full=y 匯出成功，沒有異常狀態

解決方法和規避

規避方法

有兩種，可以單獨配置，也可以兩個同時做：

開啟swap空間

swapoff -a
dd if=/dev/zero of=/swap bs=1M count=30720
mkswap /swap
chmod 600 /swap
swapon /swap
sysctl -w vm.swappiness=60
 
永久開啟swap：
vi /etc/fstab新增如下：
/swap swap swap defaults 0 0

把DATA_BUFFER_SIZE調低，不要超過總記憶體的60%。

alter system set DATA_BUFFER_SIZE=xxx SCOPE=SPFILE;

core檔案配置

echo "ulimit -c unlimited" >> /etc/profile
source /etc/profile
mkdir -p /data/corefile
chmod 777 /data/corefile/
echo "/data/corefile/core-%e-%p-%t" >> /proc/sys/kernel/core_pattern
echo "kernel.core_pattern=/data/corefile/core-%e-%p-%t" >> /etc/sysctl.conf
sysctl -p /etc/sysctl.conf

經驗總結

yasdb資料記憶體使用一般設定在系統的60%左右較好，data buff一般設定為yasdb記憶體的80%。
遇上yasdb不存在了，但是沒有生成core。很有可能就是被系統kill掉了，這時可以先去看/var/log/message資訊，核實改問題。

【YashanDB知識庫】archivelog磁碟滿導致資料庫abnormal
2024-09-14
Hive資料庫ORM
【YashanDB知識庫】YashanDB 開機自啟
2024-07-11
【YashanDB知識庫】ODBC驅動類問題定位方法
2024-05-29
【YashanDB知識庫】資料庫審計shutdown immediate操作導致資料庫異常退出
2024-07-16
資料庫
【YashanDB知識庫】YashanDB-OCI-快速上手
2024-09-27
【YashanDB知識庫】windows配置ODBC跟蹤日誌，使用日誌定位問題
2024-09-27
Windows
【YashanDB知識庫】透過觸發器複製varchar(4000 char)列的資料導致亂碼
2024-12-25
觸發器
Oracle日常問題-臨時表過多導致exp速度慢
2020-02-17
Oracle
【YashanDB知識庫】YashanDB的JDBC/OCI驅動如何設定字元編碼
2024-07-25
JDBC字元
【YashanDB知識庫】YAS-00103 no free block in dictionary cache
2024-06-26
BloC
【YashanDB知識庫】崖山資料庫Outline功能驗證
2024-09-29
資料庫
【YashanDB知識庫】繫結引數，同一個sql多個執行計劃的問題
2024-07-26
SQL
【YashanDB知識庫】由於hist_head$中analyze time小於tab$中analyze time導致的sql語句執行慢
2024-09-27
SQL
【YashanDB知識庫】收集分割槽表統計資訊取樣率小於1導致SQL執行計劃走偏
2024-07-16
SQL
oracle 序列值導致的主鍵衝突問題
2024-08-28
Oracle
【YashanDB知識庫】yac修改引數後關閉資料庫hang住
2024-07-23
資料庫
【YashanDB知識庫】YAS-02024 lock wait timeout, wait time 0 milliseconds
2024-07-11
AI
Redis使用不當導致應用卡死
2022-12-08
Redis
【YashanDB知識庫】oracle dblink varchar型別查詢報錯記錄
2024-07-17
Oracle型別
jmeter 卡死問題
2024-04-20
JMeter
【YashanDB資料庫】Mybatis-plus分頁框架識別不到Yashandb
2024-08-08
資料庫MyBatis框架
【YashanDB知識庫】v$instance檢視中例項角色含義不明確
2024-07-23
解決 Laravel 專案中使用 NPM 監聽程式碼改動導致 IDE 卡死的問題
2019-08-27
LaravelNPMIDE
使用資料庫處理併發可能導致的問題
2019-02-01
資料庫
ANALYZE導致的阻塞問題分析
2020-08-17
Scala版本與Java版本不匹配導致的找不到主類問題
2020-10-14
Java
exp匯出報錯EXP-00106問題處理
2024-01-31
Linux主機USB RNDIS網路卡驅動實現不完整導致的一例問題
2021-05-22
Linux
【YashanDB知識庫】ycm託管資料庫時，資料庫非OM安裝無法託管
2024-05-13
資料庫
mstar因裝置讀不到導致，待機重啟問題
2020-09-26
ODPS主備叢集雙向資料複製導致主備中心網路打爆問題
2021-11-08
在Sail環境中使用passport密碼授權時CURL本地環境導致PHP程式卡死問題
2021-06-28
AIPassport密碼PHP
案例：DG主庫未設定force logging導致備庫壞塊
2020-06-08
迴歸問題知識樹
2018-07-26
關於Android中使用BottomNavigationView切換橫屏導致返回主頁的問題
2019-04-20
AndroidNavigationView
“alter database switchover to xx“過程不當導致的primary-primary 雙主問題
2021-12-24
Database
總結導致oracle資料庫主機CPU sys%高的一些原因
2018-08-10
Oracle資料庫
MySQL Case-時間問題導致MySQL例項批次當機
2021-08-18
MySql

【YashanDB知識庫】EXP導致主機卡死問題

問題現象

問題風險及影響

問題影響的版本

問題發生原因

問題分析和處理過程

分析：

檢視伺服器記憶體資源

檢視yasd buff情況

測試

解決方法和規避

經驗總結

相關文章