關於BOOT和DUMP

mi_zy發表於2011-04-07

有臺P615的小機,發現ERRPT每天15點報錯:

Errpt –aj F89FB899

LABEL:          DMPCHK_NOSPACE

IDENTIFIER:     F89FB899

 

Date/Time:       Mon Apr  4 15:00:02 CUT

Sequence Number: 1739

Machine Id:      005FC74D4C00

Node Id:         FRDP-1

Class:           O

Type:            PEND

Resource Name:   dumpcheck

 

Description

The copy directory is too small.

 

Probable Causes

There is not enough free space in the file system containing the copy directory to accommodate the dump.

 

        Recommended Actions

        Increase the size of that file system.

 

Detail Data

File system name

/var/adm/ras

Current free space in kb

       20156

Current estimated dump size in kb

       26214

解決方法1,擴充套件/var的空間;方法2,取消dumpcheck操作。

取消dumpcheck處理操作的過程:

Smit-------system environments----------change/show characteristics of system dump----check dump resource utility:

check dump resourceyes改為no.

另有相關設定:
 Change the Directory to which Dump is Copied on Boot
                                                   [Entry Fields]
* DIRECTORY full pathname                            []                                                                      /
  CONTINUE Boot if Copy Fails                         no           
! You must give the directory full path name, and the directory must be in the root volume group. The default is the /var/adm/ras directory.
! If set to true and the dump cannot be copied, the boot will continue without copying the dump off the paging space. The default is no.
!Boot phase 2
The /var file system is verified using the fsck -f command and then
mounted. The copycore command checks if a dump occurred. If it did, it is
copied from default dump devices, /dev/hd6, to the default copy directory,
/var/adm/ras. Afterwards, /var is unmounted

在啟動過程init程式呼叫rc.boot 2階段,假如有dump發生,就從hd6複製到/var;
CONTINUE Boot if Copy Fails 的設定是針對這裡的,設定為yes時,假如從hd6複製到/var的操作fail,boot也會繼續;那如果設定為no,會停在那裡等你決定是否轉存到其他可移動介質上,或者取消轉存繼續引導過程。

另:如果dump裝置不是hd6,也沒有影響。

注:在AIX 系統中的lg_dumplv 邏輯卷是用於存放系統dump 的區域。 在安裝系統時是否建立該邏輯卷與伺服器的記憶體配置有關。 若伺服器的記憶體小於4GB時, 那麼在安裝 AIX 5.2 或 5.3時,系統就不會自動建立它。而預設將系統dump 存放在hd6上。
當伺服器的記憶體大於4GB時,在安裝AIX時,就會為系統 dump 建立一專用區域,該邏輯卷名就是 lg_dumplv. 其預設大小是按以下規則分配的:
. 4GB < = 伺服器的記憶體 〈 12GB lg_dump 的大小為 1GB
. 12GB < = 伺服器的記憶體 〈 24GB lg_dump 的大小為 2GB
. 24GB < = 伺服器的記憶體 〈 48GB lg_dump 的大小為 3GB
. 48GB < = 伺服器的記憶體    lg_dump 的大小為 4GB

提示:

因為CONTINUE Boot if Copy Fails預設設定為no,對於dumpcheck檢測/var/adm/ras空間不夠的機子,假如發生dump,機子在啟動時會停下,等你決定是否轉存到其他可移動介質上,或者取消轉存繼續引導過程。這在ATC伺服器的日常維護中需要額外重視,這是機子不正常啟動的原因之一!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7970627/viewspace-691818/,如需轉載,請註明出處,否則將追究法律責任。

相關文章