HACMP&Cluster相關及常用命令

spectre2發表於2012-12-03

1啟動HACMP

使用smitty clstart命令用來啟動HACMP

# smitty clstart

- 執行指令"smit clstart"回車. 等待命令執行OK,退出smit.

- 等待HACMP完全啟動,可用指令"tail -f /tmp/hacmp.out"觀察HACMP啟動狀況.

- 用指令"netstat -i"檢查IP address,確認主網路卡使用service IP adress,

備用網路卡使用standby IP address.

- 用指令"lsvg -o"檢查vary on VG,確認共享VG變為varyon狀態.

- 用指令"df"檢查mount的檔案系統.

- 確認屬於Node1online應用正常.

注:有兩種啟動HACMP的方式:

now手工啟動HACMP

restartboth在系統啟動時自動啟動HACMP

2停止HACMP

使用smitty clstop該命令用來停止HACMP

- 執行指令"smit clstop"回車.shutdown mode項選擇graceful並回車, 等待命令執行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"觀察HACMP停止狀況.

- 用指令"netstat -i"檢查IP address,確認主網路卡變為boot IP adress,備用網路卡使用standby IP address.

- 用指令"lsvg -o"檢查vary on VG,確認共享VG變為varyoff狀態.

注:有三種停止方式:

graceful: 只停止本節點上HACMP的執行,並釋放由本節點管理的資源,但允許其它節點接管。(是指在關閉雙機軟體時將呼叫客戶應用預定義的善後處理例程。)

graceful with takeover停止本節點上HACMP的執行,釋放資源,讓其他節點接管。(是指該節點將關閉雙機軟體並釋放資源請求備節點進行接管。)

forced停止本節點上HACMP的執行,但不釋放資源。(是指立即關閉雙機軟體不呼叫任何客戶應用的善後處理例程。)

3檢視cluster執行情況和HACMP狀態

使用/usr/es/sbin/cluster/clstat命令用來顯示HACMP狀態。

檢視cluster執行情況:/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以幫助你檢視當前HACMP的節點狀態。

螢幕會如下顯示:

clstat - HACMP for AIX Cluster Status Monitor

----------------------------------------------------------------

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP 節點A狀態

Interface: j50_a_srv (0) Address: 192.9.200.1 服務IP地址

State: UP 服務IP狀態

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP 心跳線狀態

Node: j50b State: UP 節點B狀態

Interface: j50_b_srv (0) Address: 192.9.200.2 服務IP地址

State: UP 服務IP狀態

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP 心跳線狀態

************************ f/forward, b/back, r/refresh, q/quit *****************

節點和CLUSTER綠色為正常,紅色表示HACMP當機或沒有起來,黃色表示HACMP處在不穩定狀態,可能是某節點HACMP正在啟動、切換、停止。

檢視HA狀態報錯

配置完powerHA5.5,在兩臺裝置上啟動hacmp雙機軟體,執行/usr/sbin/cluster/clstat檢視HA狀態報錯,報錯總體意思是clinfoES snmpd未啟動。通過lssrc -s snmpdlssrc -s clinfoES實際檢視這兩個程式已經啟動;將程式重啟結果還是一樣。奇怪,難道HA5.5不用這個命令了麼? N天之後,在IBM 官方釋出的文件上發現了此類問題的解決辦法,經過測試後果然好用,呵呵,下面把方法告訴大家哦!

編輯/etc/snmpdv3.conf檔案(每個節點都要新增),新增如下行:

 VACM_VIEW defaultView internet - included - VACM_VIEW defaultView 1.3.6.1.4.1.2.3.1.2.1.5 - included - ************************************************

檢視程式狀態

lssrc -s snmpd

lssrc -s clinfoES實時檢視這兩個程式

重啟程式clinfoESsnmpd

stopsrc -s clinfoES

startsrc -s clinfoES

stopsrc -s snmpd

startsrc -s snmpd

執行/usr/sbin/cluster/utilities/cldisp cltopinfo

以上步驟執行完後,在等23分鐘即可。

4檢視HACMP的輸出                           

#tail -f /tmp/hacmp.out

HACMP啟動時,用該命令檢視該檔案中有無報錯顯示

5檢視地址資訊

#netstat -i

用該命令檢視網路卡繫結的地址型別是否正確,三種型別:boot1boot2service

6檢視邏輯卷組和檔案系統

#lsvg -o

用該命令檢視應該啟用(varyon)VG是否啟用。

#mount

用該命令檢視應該mount上的檔案系統是否正常。

7、檢視HACMP配置情況

# /usr/es/sbin/cluster/utilities/cllscf 顯示群集拓樸

# /usr/es/sbin/cluster/utilities/cllsclstr 顯示群集定義

# /usr/es/sbin/cluster/utilities/cllsnode 按節點顯示拓樸資訊

# /usr/es/sbin/cluster/utilities/cllsnw 按網路名稱顯示拓樸資訊

# /usr/es/sbin/cluster/utilities/cllsif 按網路卡顯示拓樸資訊

# /usr/es/sbin/cluster/utilities/clshowres 顯示資源組資訊

8、檢視Cluster的程式狀態:

# ps -ef | grep cluster

注:應有三個HACMP程式:clstrmgrclinfoclsnuxpd

9、檢視Cluster的日誌及錯誤資訊(HACMP環境下的排錯):

HACMPLOG檔案:以下檔案都是文字檔案,可以用VI來看.每個日誌檔案都含有每個資訊的產生時間.

/usr/adm/cluster.log   :記錄了HACMP的狀態,HA的守護程式所產生.

/tmp/hacmp.out         :記錄了HA的詳細指令碼.

/usr/sbin/cluster/history/cluster.mmdd :記錄了HA的各個事件的發生.

/tmp/cm.log            :clstrmgr程式產生,每次HA重起時會被覆蓋.

注:可以在啟動HACMP時使用 # tail f /tmp/hacmp.out命令,以檢視HACMP的啟動是否正常或跟蹤啟動時的錯誤資訊。

10、檢視Cluster執行的歷史記錄:

# cd /usr/sbin/cluster/history

注:此目錄下存放著每天的Cluster執行記錄

11、檢視Cluster執行時的網路情況及資源組的使用情況:

HACMP啟動之前:

# netstat -i

此時應可以看到bootstandby地址

# lsvg -o

此時只能看到本地的VG

HACMP啟動之後:

# netstat -i

此時應可以看到servicestandby地址

# lsvg -o

此時應可以看到本地的VG及共享VG

12、儲存和恢復Cluster的配置:

儲存cluster的配置:

#smitty hacmp

選擇:Cluster ConfigurationCluster SnapshotsAdd a Cluster Snapshot

鍵入Snapshot檔名(Cluster Snapshot Name

恢復cluster的配置:

# smitty hacmp

選擇:Cluster ConfigurationCluster SnapshotsApply a Cluster Snapshot

鍵入Snapshot檔名(Cluster Snapshot Name

注:選單中各項的意義:

Cluster Snapshot Name指定Cluster Snapshot的檔名

Cluster Snapshot Des criptionCluster Snapshot地描述

Un/Configure Cluster Resource是否重新配置Cluster資源

Force Apply if verify failsCluster校驗失敗時,是否強制恢復配置

13、注意:向由HACMP管理的共享VG中增加FS時的具體步驟為:

1)、# smitty

選擇:System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

選擇共享VG

指定FS的大小,Mount point

2)、# smitty clstop

停止HACMP的執行

3)、在增加FS的節點上作:

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一個節點上作:

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是將新加入的FS的定義取過來

4)、# smitty hacmp

選擇:cluster configuration

cluster resources

define resource group

change/show resources for a resource group

將增加的FS加入到Cluster資源組的定義中

5)、# smitty hacmp

選擇:cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的資源組的配置

6)、# smitty hacmp

選擇:cluster configuration

cluster verification

進行Cluster配置的校驗

14Cluster的配置引數:

引數名稱引數值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

檢查心跳線是否已經配置好:

1、在兩臺上分別輸入如下命令:

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2機能接收到資訊,則表明心跳線已經配置好

2、測試心跳線是否可以正常工作:

A機上:

# stty

B機上:

# stty

如果在兩臺主機上均出現了該TTY的配置資訊,則說明心跳線設定正確。

安裝HACMP時,一般不選擇全部安裝,只安裝一部分關鍵的軟體,如cluster.adtcluster.basecluster.cspoccluster.doc.en_US

15HA可把故障機的應用及其資源(包括用到的IP地址和磁碟空間等)接管過來.

1/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6/usr/es/sbin/cluster/utilities/clshowres -g'sxptt_con_rg'

Show Resource Information by Resource Group

7/usr/es/sbin/cluster/utilities/clshowres -n's85a'

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三種節點關係

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA啟動指令碼:/usr/sbin/cluster/local/app_start1

HA停止指令碼:/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskxPP的狀態

lspv hdiskx hdiskx上的詳細資訊

lspv 看硬碟及所在VG

lslv lv00 檢視LV狀態

lsvg -p datavg 看指定VG上所有的硬碟

16、人為接管HACMP

在某些維護情況下,需將某節點的HACMP及應用切換至另一節點.

- 執行指令"smit clstop"回車.shutdown mode項選擇takeover並回車, 等待命令執行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"觀察HACMP停止狀況.

- 用指令"netstat -i"檢查IP address,確認主網路卡變為boot IP adress, 備用網路卡使用standby IP address.

- 用指令"lsvg -o"檢查vary on VG,確認共享VG變為varyoff狀態.

- 在另一節點執行相同命令,確認網路卡,VG及應用接管成功。
17、如何刪除系統發給root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

18HACMP一些常用的命令

clshowsrv –v

查詢HACMP子系統的狀態

clRGinfo

顯示資源組目前的狀態

cllscf/cltopinfo

顯示叢集拓撲結構資訊

clshowres

顯示資源組的配置資訊

cllsnwcllsif

顯示叢集網路資訊

clstat(需要啟動clinfoES服務)

顯示叢集內所有節點執行情況

/usr/sbin/snap –e

collects the hacmp data.

/usr/sbin/rsct/bin/dhb_read –p devicename –r/-t

test the link status of the disk heartbeating path.

clpasswd

Changes a user’s password on each node in the cluster.

cllsdisk

Lists PVIDs of accessible disks in a specified resource chain

cllsvg

List volume groups accessible in a specified resource chain.

cllsparam

Lists runtime parameters.

cl_clstop

Stops cluster services on nodes running C-SPOC.

cl_lsfs

Displays shared filesystem attributes for all cluster nodes.

cl_lsgroup

Displays group attributes for all cluster nodes.

cl_lslv

Displays shared logical volume attributes for cluster nodes.

cl_lsuser

Displays user account attributes for all nodes.

cl_lsvg

Displays shared volume group attributes for cluster nodes.

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/14184018/viewspace-750444/,如需轉載,請註明出處,否則將追究法律責任。

相關文章