客戶系統報錯:soft lockup的解決辦法

warehouse發表於2016-09-28

redhat os日誌如下:伺服器會重啟,負載重的時候會這樣

Sep 28 02:14:00 hpdb1 kernel: BUG: soft lockup - CPU#40 stuck for 23s! [java:79542]

Sep 28 02:14:00 hpdb1 kernel: Modules linked in: bridge stp llc oracleacfs(P)(U) oracleadvm(P)(U) oracleoks(P)(U) oracleasm autofs4 sunrpc pcc_cpufreq ipv6 ext3 jbd uinput microcode pcspkr serio_raw iTCO_wdt iTCO_vendor_support hpilo hpwdt i7core_edac edac_core sg tg3 ext4 mbcache jbd2 dm_round_robin sr_mod cdrom sd_mod crc_t10dif pata_acpi ata_generic ata_piix hpsa qla2xxx scsi_transport_fc scsi_tgt radeon ttm drm_kms_helper drm hwmon i2c_algo_bit i2c_core dm_multipath dm_mirror dm_region_hash dm_log dm_mod [last unloaded: scsi_wait_scan]

Sep 28 02:14:00 hpdb1 kernel: CPU 40


參考了這篇文章,嘗試解決一下:

http://blog.csdn.net/zgl07/article/details/46493421

--=============================

為了防止上面連結過期,複製內容如下:

近期在伺服器跑大量高負載程式,造成cpu soft lockup。如果確認不是軟體的問題。採用下面的解決辦法。

echo 30 > /proc/sys/kernel/watchdog_thresh 


sysctl -w kernel.watchdog_thresh=30
/etc/sysctl.conf 

kernel.watchdog_thresh=30

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/19602/viewspace-2125710/,如需轉載,請註明出處,否則將追究法律責任。

相關文章