Oracle OGG日常維護

jason_yehua發表於2022-12-02

OGG  常用命令

進入到 OGG   home  目錄  一般為 /odc,  執行 ./ggsci

1.        檢視全部程式狀態  info all

Program:  程式型別

Status:  程式狀態

Group:  程式名

Time since chkpt  :程式不一致時間

2.        檢視某個程式的詳細資訊: info ext1

程式的 seqno   : 426 RBA 23065088

3.        程式啟停命令

start mgr  開啟管理程式(必須先於其他程式啟動)

start *    開啟其他所有程式

start ext1  開啟某一指定程式    group    即為程式名)

stop mgr  停止管理程式

stop *    停止所有程式

stop ext1  停止某一指定程式

 

4.        檢視 OGG  系統日誌

view report ggserr

View report ext1  指定某一程式名


 

故障排查步驟

1.        檢視  OGG  狀態,把終止的程式啟動。

2.        啟動命令發出以後,多檢視一會程式狀態,例如  info all  檢視程式狀態。!重複執行上次操作。

3.        如果程式狀態仍然為  STOPPED    ABENDED  ,則可檢視程式日誌或  ggserr.log

此為  OGG  網路問題引起,網路被拒絕。很可能為目標端  mgr  程式沒有啟動。

即使有時候程式狀態為  RUNNING  ,但是  Time since chkpt  時間沒有減少,或者沒有到  Lag at chkpt  上去,  OGG  都是有問題的。

 

常見錯誤

1.  檢視源端程式日誌,報錯資訊為:

2015-04-30 12:31:27  ERROR   OGG-01031  Oracle GoldenGate Capture for Oracle, p_emr.prm:  There is a problem in network communication, a remote file problem, encryption keys for target and source do not match (if using ENCRYPT) or an unknown error. (Reply received is Unable to open file "./dirdat/trace/hzss/p_emr/la012279" (error 13, Permission denied)).
  2015-04-30 12:31:27  ERROR   OGG-01668  Oracle GoldenGate Capture for Oracle, p_emr.prm:  PROCESS ABENDING.

目標端對應的報錯資訊:

2015-04-30 19:34:52  WARNING OGG-01519  Waiting at EOF on input trail file ./dirdat/trace/hzss/p_emr/la012279, which is not marked as complete; but succeeding trail file ./dirdat/trace/hzss/p_emr/la012280 exists. If ALTER ETROLLOVER has been performed on source extract, ALTER EXTSEQNO must be performed on each corresponding
  downstream reader.

原因是由於源端到目標端的網路中斷,導致 datapump  投遞程式 abended

解決方法:

源端的投遞程式產生新的檔案點:
  GGSCI (oggdb01) 3> alter extract p_emr etrollover
  2015-04-30 12:47:24  INFO    OGG-01520  Rollover performed.  For each affected output trail of Version 10 or higher format, after starting the source extract, issue ALTER EXTSEQNO for that trail's reader (either pump EXTRACT or REPLICAT) to move the reader's scan to the new trail file;  it will not happen automatically.
  EXTRACT altered.
  GGSCI (oggdb01) 4> start p_emr
  
目標端的  replicat  複製程式從新的序列號開始(  la012280 
  GGSCI (localhost) 3> stop hzss-r2
  GGSCI (localhost) 4> alter replicat hzss-r2 extseqno 12280 extrba 0
  GGSCI (localhost) 5> start hzss-r2

 

2.  處理不同步的表
先停掉目標端的  replicat  複製程式(確保  scn  號一致)
從源端按  SCN  號匯出不同步的表:

expdp system/oracle directory=dmpdir dumpfile=zjhis_tab20150522.dmp logfile=zjhis_tab20150522.log tables=zjhis.CF_DUOMEITI,zjhis.CF_XIANGMUZD,zjhis.YZ_INPATIENT_ORDER flashback_scn = 12585744134590

 

  dmp  檔案匯入到目標端  :

impdp system/oracle directory=dmpdir dumpfile=zjhis_tab20150522.dmp logfile=impdp20150522.log 
  remap_schema=zjhis:sq_zjhis  table_exists_action=replace

  replicat  複製程式裡新增如下引數:
  map zjhis.CF_DUOMEITI, target sq_zjhis.CF_DUOMEITI, filter (@GETENV ("transaction", "csn") > 12585744134590);
  map zjhis.CF_XIANGMUZD, target sq_zjhis.CF_XIANGMUZD, filter (@GETENV ("transaction", "csn") > 12585744134590);
  map zjhis.YZ_INPATIENT_ORDER, target sq_zjhis.YZ_INPATIENT_ORDER, filter (@GETENV ("transaction", "csn") > 12585744134590);

 

3.  源端啟動  datapump  投遞程式時,報錯如下:

2015-11-23 20:28:58  ERROR   OGG-01031  There is a problem in network communication, a remote file problem, encryption keys for target and source do not match (if using ENCRYPT) or an unknown error. (Reply received is Unable to open file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable)).

大概意思如下:
網路通訊中存在一個問題,一個遠端檔案問題,目標和源的加密金鑰不匹配(如果使用加密)或一個未知的錯誤。(收到的回覆是無法開啟的檔案  “/opt/app/ogg/dirdat/trace/his/la000951”      error 11,  資源暫時不可用))

 

檢視目標端的  ggserr.log  檔案,在出錯的時間段內     檢索  la000951  檔案,發現如下比較明顯的資訊:

2015-11-23 13:30:49  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to lock file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).  Lock currently held by process id (PID) 26115.
  2015-11-23 13:34:46  INFO    OGG-01669  Oracle GoldenGate Collector for Oracle:  Opening /opt/app/ogg/dirdat/trace/his/la000951 (byte -1, current EOF 1194).
  2015-11-23 13:34:56  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to lock file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).  Lock currently held by process id (PID) 26115.
  2015-11-23 13:34:56  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to open file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).

原因是源端的  datapump  程式要往目標端的第  951    trail  檔案寫資料,而此時目標端的該檔案被編號為  26115  的系統程式所鎖定,造成源端無法開啟檔案而  abended 

 

解決:
查詢到該系統程式,  kill  掉。最終重新啟動  pump  程式成功。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31547506/viewspace-2926353/,如需轉載,請註明出處,否則將追究法律責任。

相關文章