WAS startnode hang問題解決

pingyuan發表於2010-07-05

WAS startnode hang問題解決

[@more@]

WAS的叢集環境,假設192.168.1.10為A機 192.168.1.20為B機,A、B兩機做Cluster,Dmger在A機。因為春節下電,開機時現象是,Dmger正常,B機上的Node正常啟動,但是A機上的Node啟動時,出現“”後,無響應,查詢系統啟動日誌,無記錄。

檢查一下作業系統的狀態,記憶體、磁碟空間一切正常。ps -ef|grep java系統程式也在。

諮詢800,只是讓按要求收集資訊:
http://www-1.ibm.com/support/docview.wss?rs=180&context=SSCMPB9&q1=MustGatherDocument&uid=swg21052641&loc=en_US&cs=utf-8&lang=en

開啟trace檢視node啟動的問題記錄:
#startNode.sh -trace
從系統日誌中無法看出系統異常。
於是聯想到去年曾經在配置結點時federate異常,最後是因為JVM的share memory問題造成。最後IBM建議按該問題處理。

1、啟動dmgr,在管理控制檯系統管理中,選擇無法啟動的那個nodeagent,在程式管理->程式定義->java虛擬機器 的通用jvm引數裡新增“-Xshareclasses:nonfatal”,儲存。
(檢視configcellsnodesserversnodeagentserver.xml
確認genericJvmArguments裡設定了-Xshareclasses:nonfatal)

2、在無法啟動的節點的bin下執行syncNode命令,強制節點配置於dmgr同步,同步後檢視configcellsnodesserversnodeagentserver.xml,
確認genericJvmArguments裡設定了-Xshareclasses:nonfatal。

3、啟動nodeagent。

設定後,重啟Dmgr和Node後,Node正常啟動!據說WAS 6109會對share classes問題修正。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7199667/viewspace-1034960/,如需轉載,請註明出處,否則將追究法律責任。

相關文章