安裝rac時需要注意的問題

記錄每一次錯誤發表於2018-11-19

安裝rac時需要注意的問題

1.虛擬機器新增共享磁碟,



1)建立磁碟

在虛擬機器軟體的安裝目錄下,有個vmware-vdiskmanager.exe檔案(老版本用plainmaker.exe),執行該命令:

D:/Program files/VMware/VMware Workstation>vmware-vdiskmanager.exe -c -s 20000MB -a lsilogic -t 2 d:/share/sharedisk.vmdk

以上命令在D盤的share資料夾下生成了個20GB的磁碟,有兩個檔案:

sharedisk-flat.vmdk 

sharedisk.vmdk



2)分別開啟兩臺虛擬機器目錄中的vmx檔案,在最後一行新增: 

scsi2:0.shared="TRUE" 

disk.locking="FALSE" 

scsi2:0.SharedBus="Virtual"



3)如果scsi_id -u -g /dev/sdb命令沒有返回值時,在虛擬機器中新增

disk.EnableUUID = "TRUE"  



2.asm磁碟用udev建立,不用安裝asm和asmlib,udev建立的磁碟不需要格式化成檔案系統,否則不能用。



3.一般在安裝grid軟體時,找不到兩個節點,一般都是ssh互信沒有設定好。

檢查ssh互相,knowhost置空,登入一下兩個節點knowhost檔案就有內容了。

oracle使用者和grid使用者都要建立互信。

$ssh rac1

$ssh rac2



4./etc/hosts,要配置好ip,vip ,privateip



5.安裝cvuqdisk包

在grid安裝包目錄下,rpm -Uvh cvuqdisk*  



6.建立使用者和組,注意oracle和grid使用者的許可權和組



7.配置ntp時間同步時,虛擬機器rac1的一個網路卡要配置成NAT模式,並且ip是DHCP自動獲取的才可以連外網。

rac2的ntp.config裡配置的是rac1的ip,啟動ntp服務。

兩個節點的/etc/resolv.conf檔案要保持一致。



8.grid安裝最後報scanip的問題可以忽略

INS-20802



9.安裝完grid,去grid使用者下去配置asm磁碟組

$asmca

建立完磁碟要看到所有磁碟都是掛載狀態才可以。並且第一欄下asm例項都是啟動狀態。



10.切換到oracle使用者下,安裝oracle軟體

INS-30131

INS-30131

都是/tmp訪問許可權的問題

解決方法:清空/tmp目錄



11.叢集的操作命令都在root使用者下執行,在grid使用者下會提示許可權不足。

/u01/app/11.2.0/grid/bin



12.報錯ssh:connect to host rac1 port 22:NO route to host

檢視/etc/hosts檔案,ip地址



13../crsctl check crs

四個online才對

/etc/hosts和ssh互相可以影響到兩個online,1,CRS;2.EM



14.在安裝grid軟體和oracle軟體時,最後執行的root.sh指令碼都要在兩個節點上執行,一個執行完,再執行另一個節點。

此時,./crs_stat -t -v 可以看到兩個節點的狀態,如果只在rac1上執行root.sh,檢視叢集狀態時,看不到rac2節點。



15.dbca建庫時報ORA-09925:unable to create audit trail files

這時,要點選brower瀏覽按鈕,看看有沒有asm磁碟組顯示,如果沒有,按照以下步驟去檢查。

1) gi家目錄或者其子目錄許可權錯誤



2)asm磁碟的許可權錯誤



3)asm例項未啟動或者asm磁碟組沒有mount上



4)asm磁碟組資源沒有線上



5)oracle使用者的許可權錯誤



6)oracle($ORACLE_HOME/bin)可執行檔案的許可權錯誤

$cd /u01/app/oracle/11.2.0/db_1/bin/oracle

[root@rac01 bin]# ls -ltr oracle

-rwsr-s--x 1 oracle asmadmin 232399431 Feb 19 08:10 oracle/u01/app/grid/11.2.0/bin/oracle

$cd /u01/app/grid/11.2.0/bin/oracle

[root@rac01 bin]# ls -ltr oracle

-rwsr-s--x 1 grid oinstall 203974257 Feb 19 07:28 oracle



16.將rac1上的監聽檔案複製到rac2上,修改ip,啟動rac2監聽

$lsnrctl start

檢視叢集監聽

./srvctl status listener



17.叢集重啟

磁碟要設定成開機自動掛載,系統磁碟。

叢集停機

$./crsctl stop cluster -all

這時可能會報[crs-4000]rac2未在規定時間內響應

在rac1上啟動叢集./crsctl start cluster -all

仍報[crs-4000]rac2未在規定時間內響應

但是在兩個小時後,檢視叢集狀態時,./crs_stat -t -v時正常了,可以看到兩個節點online.

再次關停叢集,成功關閉兩個節點,

再次開啟叢集,成功online兩個節點。

此次事件,原因不明,有可能是虛擬機器資源不足的問題。



18.檢視叢集資源狀態

$./crsctl stat res -t -init

一般是所有資源都是online只有ora.diskmon是offline,不過這個資源是exadata環境下的,不必理會。



19.檢視磁碟組

在grid使用者下

$asmcmd

>lsdg   顯示磁碟狀態

$./ocrcheck檢查裁決盤



20.檢視各種日誌及其路徑

oracle 下的alert日誌$ORACLE_BASE/diag/rdbms/orcl/orcl1/trace/alertorcl1.log

grid 下的 alert 日誌 $ORACLE_HOME/log/rac1/alertrac1.log

css的日誌$ORACLE_HOME/log/rac1/cssd/cssd.log  ocssd.log

crs的日誌$ORACLE_HOME/log/rac1/crsd/crsd.log

ohas的日誌$ORACLE_HOME/log/rac1/ohasd/ohasd.log

evm的日誌$ORACLE_HOME/log/rac1/evmd/evmd.log

dbca的日誌$ORACLE_BASE/cfgtoollogs/dbca



21.檢查ACFS驅動狀態

$./acfsdriverstate version

ACFS-9129:ADVM/ACFS NOT INSTALLED.

去安裝$./acfsroot install

ACFS-9348 unable to remove '/etc/udev/rules.d/55-usm.rules'

檢視後,實際上沒有這個檔案,那就先去這個路徑下建立一個同名空檔案,安裝透過。

啟動ACFS服務./acfsload start -s



22.有時asm磁碟組在某一個節點無法掛載,重啟虛擬機器就好了。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31547066/viewspace-2220589/,如需轉載,請註明出處,否則將追究法律責任。

相關文章