我的oracle enterprise grid control曲折之路

wangguangli發表於2009-04-17


最近,一直在研究oracle enterprise grid control。從看文件到配置完成,經過了很多的曲折,下面描述如下,希望我的收穫也能給朋友們以參考。

1、  環境:

OsIBM aix 5.3.0.8

Cpu2×2.2G Hz

Memory 10G

磁碟:內建硬碟,168G

這其實是我的一臺練習機器的分割槽。

2、  安裝步驟;

a)         軟體資源準備

在下載軟體之前,我先在itpub.net上,下載了1.12.0版的ou sgOracle的軟體下載還不錯,我的速度大約1MB/s。我想安裝的是oracle enterprise grid control 10.2.0.4,但是必須下載oracle enterprise grid control 10.2.0.1full installer)和oracle enterprise grid control 10.2.0.4 patch set),這也是oracle的特色吧。軟體下載完成後,ftp到我的機器上,主機名:gridi4。注意,這個不是一個普通的名字,這個名字至少浪費了我兩天時間。詳情見下文。

boracle基本環境準備,這和以往的安裝差不多。注意,差不多,還是差很多。

首先建立了2個檔案系統:/oracle/oracle_software。分別用於安裝軟體和存放安裝介質。把軟體上傳到gridi4上之後,估計有部分人就會傻眼了,副檔名是“.zip”,aix下沒有命令能夠解壓,還是oracle想得周全,在下載頁面有個連結,提供各種版本的unzip供大家使用,廢話不說,弄個檔案,放在了gridi4/bin目錄下,解壓縮用如下方式即可:

#unzip –d AIX_Grid_Control_full_10201_disk1.zip

--這個命令自動把多卷解壓縮在一個目錄下。

這樣軟體就準備好了。

3)那就開始裝吧。這裡有個問題,需要大街注意,那就是.profile。一般說來,安裝oroacle軟體,例如資料庫,每個安裝文件總是講要先配置環境變數,但這次不同。只需要建立oracle使用者和dba組即可,不需要設定oracle.profile內容。

把下載的安裝介質解壓,需要用到mpiounzip,如果不會用,自己google吧。

進入到解壓好的Disk1的目錄,執行:

$./runInstaller

一般來講,如果你想省點事的話,選擇安裝到新新建資料庫中。因為repository內容要儲存在資料庫中,這個版本內建的是10.0.0.1版本的oracle 10g。前半程沒有什麼問題,一路“next”下去,和安裝oracle資料庫差別不大,也會用 root 執行2個指令碼。到了最後的環節,很多人會出錯。配置omsagent,這是最後兩個步驟,很多人都會功虧一簣。

為什麼會出現這樣的現象呢?我分開講述。

(1)      配置oms錯誤,多半問題出現在listener上,如果這臺機器上原來有listener,並且port 1521,則肯定會出錯。因為新裝的10.0.0.1listener與原有的listener port1521)衝突,如何解決呢?修改原有listenerport

(2)      配置agent錯誤,這個問題出現的比較搞笑。我在2周內安裝了10幾次,沒有一次成功,全部是卡在這了。因為軟體安裝在最後,會生成agent模組的配置檔案:

/oracle/OracleHomes/agent10g/sysman/config/emd.properties。其中關鍵點有三行:

REPOSITORY_URL=https://gridi4:1159/em/upload

emdWalletSrcUrl=http://gridi4:4889/em/wallets/emd

EMD_URL=https://gridi4:3872/emd/main/

在網上,很多解決方案均提到了主機名配置問題,但我認為沒說到點上。關鍵點就一個:主機名不要有大寫,/etc/hosts配置不要弄錯就可以了。我最開始的主機名:GRIDI4,安裝到配置agnet的時候,以上三行中,主機名有兩個是大寫,一個是小寫,總是不能通過。這是安裝程式指令碼的bug,奉勸大家,如果想順利安裝,主機名一定要小寫。我在碰壁多次之後終於醒悟了,改為了小寫,結果到這還是不能成功。看網上的文件,一般不詳解這個問題,我在有實驗了幾次之後,決定不管三七二十一,打補丁吧,說不定,10.2.0.1aix還有除了主機名大小寫之外的問題。

老天不負有心人,我在打了補丁之後,竟然成功了。

在這插敘一下,如何打補丁。其實很簡單,解壓縮補丁介質之後,進到3731593這個目錄,執行runInstaller,在選擇安裝目錄時,在上方下來選單裡面選擇oms10gagent10g即可,當然,安裝前一定要停掉omsagent服務(好像它就沒起來過),安裝兩遍,dell的文件說安裝四遍,我看不需要,除非你還想把內建的oracle 10g 10.0.0.1也升級。

安裝完補丁,不出意外的話,就可以啟動了,我找了瀏覽器,輸入http://gridi4:4889/em/,出現了登入介面,登入後,發現“home”下的“overview”中,出現了up1unkonw13,這說明agent其作用了,分別進入到agnet裡面配置一下,就成為up13unkonwn1了,這個unkownmicrosfot mom,IBM機器沒有這些東西,所以不用管它。

 

終於安裝成功了,我的心情很舒暢,我想歌唱,啦啦啦……..,怎麼我的securecrt登陸視窗死掉了,再重新整理網頁也不行了,這是為什麼呢?我剛感受到成功的喜悅,怎麼又給我當頭一棒呢!

各位請認真看了,以下才是本文的重點,當然前面所述與以下內容也有關。

我重新登入終端視窗以後,執行:

bash-3.2$ ./emctl status agent

Oracle Enterprise Manager 10g Release 4 Grid Control 10.2.0.4.0. 

Copyright (c) 1996, 2007 Oracle Corporation.  All rights reserved.

---------------------------------------------------------------

Agent is Not Running

我的天,怎麼剛成功就又停掉呢?分析作業系統日誌,發現大量的軟體異常終止錯誤,都和agent10g有關,他為什麼剛起來就停掉呢?分析agent10gemd.trc,發現最後幾條說系統沒有足夠的記憶體,不會吧,我的機器可是有10G的記憶體,很多人的生產機的配置也不一定比我的好啊,難道還執行不了你這grid control。肯定有記憶體洩漏,agent程式被作業系統強行結束了。回想一下,確實有很多可疑的地方,例如我在安裝的時候,xmanager視窗多次強行結束,這在以前從未出現過。又經過一番狂搜,終於在韓國人的oracle 論壇上找到了答案:

修改oracle使用者的profile,新增如下內容:

LDR_CNTRL="MAXDATA=0x80000000"

export LDR_CNTRL

AIXTHREAD_SCOPE=S

export AIXTHREAD_SCOPE

AIXTHREAD_MUTEX_DEBUG=OFF

export AIXTHREAD_MUTEX_DEBUG

AIXTHREAD_RWLOCK_DEBUG=OFF

export AIXTHREAD_RWLOCK_DEBUG

AIXTHREAD_COND_DEBUG=OFF

export AIXTHREAD_COND_DEBUG

然後重新啟動agent,一切ok,我的系統連續執行幾天,在沒有出現過記憶體洩露的情況,系統負載很輕,oem介面一切正常。我成功了!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/115963/viewspace-590749/,如需轉載,請註明出處,否則將追究法律責任。

相關文章