vmware RHEL AS4 RAC安裝出錯問題總結

oxoxooxx發表於2010-12-30

1.
在vmware中新增了共享磁碟,在系統中使用fdisk -l不能識別
報錯:
Warning: invalid flag ox0000 of partition table 4 will be corrected by w(rite)
--
需要在虛擬機器vmx檔案中新增配置:
scsi1.shareBus = "virtual"

2.
在一個節點rac1使用fdisk /dev/sdb完成共享磁碟的分割槽後,
在第二個節點使用partprobe命令識別分割槽,不能識別
--
檢查發現在rac2節點上掛載了光碟裝置/dev/hdc,解除安裝關盤後重新執行partprobe,命令成功.

3.
使用partprobe命令在第二個節點發現磁碟分割槽,命令執行成功,但使用fdisk -l命令檢視,看不到共享磁碟分割槽.
--?scsi掛載的特殊要求?怎麼編號的?
共享儲存是應該選用scsi1:0,否則分割槽後第二個節點無法識別。
#關閉兩個節點系統
#選擇修改虛擬機器裝置,將第一塊共享磁碟裝置型別修改為scsi1:0
#編輯虛擬機器兩個節點的vmx檔案,將之前的scsi1:1 修改為scsi1:0

新增scsi1:1 scsi1:2 兩個scsi裝置後,在一個節點分割槽,在另一個使用partprobe無法識別:
--
解決:重新啟動節點,則能識別到了

4.
[root@GXJVM1 root]# /etc/init.d/oracleasm createdisk VOL1 /dev/sdc1
Marking disk "/dev/sdc1" as an ASM disk: Error opening manager: No such device or address
--
重新執行一下:/etc/init.d/oracleasm configure 在兩個節點都要執行

另一個節點執行:
# /etc/init.d/oracleasm scandisks
# /etc/init.d/oracleasm listdisks

5.
chkconfig 命令的使用:
1.檢視服務在各個啟動級別的配置:
chkconfig --list service_name
eg:chconfig --list rawdevices
2.在特定的級別開啟服務自動啟動
chkconfig --level 2345 rawdevices on

6.
RAC中在一個節點配置asmdisk,在另一個節點執行如下命令/etc/init.d/oracleasm scandisks
後/etc/init.d/oracleasm listdisks不能識別出磁碟
--解決:
經高手提示發現下面sharedBus寫成了shareBus,修改:
scsi1.sharedBus = "virtual"
並新增如下配置資訊:
diskLib.dataCacheMaxSize = "0"
diskLib.dataCacheMaxReadAheadSize = "0"
diskLib.DataCacheMinReadAheadSize = "0"
diskLib.dataCachePageSize = "4096"
diskLib.maxUnsyncedWrites = "0"

7.
手動指定網路卡配置資訊:
ifconfig eth0 address xxx.xxx.xxx.xx netmask 255.255.255.0

8.
在clusterware安裝最後執行root.sh的過程彈出視窗報錯OUI-25031,是因為RAC的VIP預設不允許繫結在私有地址上.
--解決方法:
不關閉當前的出錯視窗;
在另一個節點上新開一個終端,呼叫/etc/product/crs/bin/vipca,按照提示進行相關的設定;
回到前一個節點,確認彈出視窗,並再次執行安裝後檢查即可.

9.
在呼叫圖形化安裝指令碼時報錯:xhost unable to open display
--解決方法:
先在root下xhost +
在切換回要使用的oracle使用者:su oracle
後執行:./runInstaller

10.
在從普通使用者切換到oracle使用者的時候需要oracle使用者密碼,
書中配置oracle使用者時忘了設定oracle使用者的密碼:
--解決方法:
設定使用者密碼
>passwd oracle

11.
正確的配置RAC的/etc/hosts檔案
127.0.0.1 localhost.localdomain localhost ##次行必須如此配置
192.168.100.110 dbp
192.168.100.108 dbs
...
202.96.128.166

12.
開機執行到sendmail後切入Enabling swap space長時間等待
#service sendmail stop //停止sendmai服務//
#chkconfig sendmail off //使下次開機不執行sendmail服務//
檢視chkconfig的幫助資訊:
chkconfig --help
確認服務已經被禁掉:
chkconfig --list |grep service_name

13.
1.檢查磁碟空間 fdisk -l
df
2.檢查/etc/fstab

14.
執行clusterware安裝指令碼時報如下錯誤:
/u01/app/oracle/product/10.2.0/crs_1/bin/crsctl.bin: error while loading shared libraries: libstdc++.so.5:
cannot open shared object file: No such file or directory
檢視程式執行所需要的共享庫:
[root@hostXXX ~]# ldd /u01/app/oracle/product/10.2.0/crs_1/bin/crsctl.bin
libclntsh.so.10.1 => not found
libhasgen10.so => not found
libocr10.so => not found
libocrb10.so => not found
libocrutl10.so => not found
libskgxn2.so => not found
libdl.so.2 => /lib64/libdl.so.2 (0x0000003830600000)
libm.so.6 => /lib64/libm.so.6 (0x0000003830a00000)
libpthread.so.0 => /lib64/libpthread.so.0 (0x0000003830e00000)
libnsl.so.1 => /lib64/libnsl.so.1 (0x0000003833a00000)
libstdc++.so.5 => not found
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x0000003842400000)
libcxaguard.so.5 => not found
libc.so.6 => /lib64/libc.so.6 (0x0000003830200000)
/lib64/ld-linux-x86-64.so.2 (0x000000382fe00000)
--解決方法:
安裝compat-libstdc++-33-3.2.3-47.3.i386.rpm

15.在我安裝完clusterware安裝資料庫進行產品配置相關的前置需求檢查時有兩個warning,一個是關於實體記憶體小的提醒,
另一個提示檢查作業系統核心引數的時候kernel.sem不符合要求,後面因為在這裡忽略了這個warning導致安裝oracle database進行的一半的時候報錯.
解決方法:
新開一個終端;
編輯/etc/sysctl.conf檔案,修改引數kernel.sem=250 32000 100 128,儲存;
使用sysctl -p命令是設定生效;
回到之前的視窗點確定繼續.

--參考
1.下面這兩個命令,可以進行檢視已經格式化後的檔案系統的相關情況
tune2fs -l /dev/sda1 | grep Block
dumpe2fs /dev/sda1


--問題
為什麼從一個節點ssh到另一個節點,成功了,但會話死掉打了.

[@more@]

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23937368/viewspace-1043824/,如需轉載,請註明出處,否則將追究法律責任。

相關文章