OGG日常維護文件

yingyifeng306發表於2021-02-20

OGG 常用命令

進入到 OGG home 目錄 一般為 /odc, 執行 ./ggsci

1.       檢視全部程式狀態 info all

Program: 程式型別

Status: 程式狀態

Group: 程式名

Time since chkpt :程式不一致時間

2.       檢視某個程式的詳細資訊: info ext1

程式的 seqno : 426 RBA 23065088

3.       程式啟停命令

start mgr 開啟管理程式(必須先於其他程式啟動)

start *   開啟其他所有程式

start ext1 開啟某一指定程式 group 即為程式名)

stop mgr 停止管理程式

stop *   停止所有程式

stop ext1 停止某一指定程式

 

4.       檢視 OGG 系統日誌

view report ggserr

View report ext1 指定某一程式名


 

故障排查步驟

1.       檢視 OGG 狀態,把終止的程式啟動。

2.       啟動命令發出以後,多檢視一會程式狀態,例如 info all 檢視程式狀態。!重複執行上次操作。

3.       如果程式狀態仍然為 STOPPED ABENDED ,則可檢視程式日誌或 ggserr.log

此為 OGG 網路問題引起,網路被拒絕。很可能為目標端 mgr 程式沒有啟動。

即使有時候程式狀態為 RUNNING ,但是 Time since chkpt 時間沒有減少,或者沒有到 Lag at chkpt 上去, OGG 都是有問題的。

 

常見錯誤

1. 檢視源端程式日誌,報錯資訊為:

2015-04-30 12:31:27  ERROR   OGG-01031  Oracle GoldenGate Capture for Oracle, p_emr.prm:  There is a problem in network communication, a remote file problem, encryption keys for target and source do not match (if using ENCRYPT) or an unknown error. (Reply received is Unable to open file "./dirdat/trace/hzss/p_emr/la012279" (error 13, Permission denied)).
  2015-04-30 12:31:27  ERROR   OGG-01668  Oracle GoldenGate Capture for Oracle, p_emr.prm:  PROCESS ABENDING.

目標端對應的報錯資訊:

2015-04-30 19:34:52  WARNING OGG-01519  Waiting at EOF on input trail file ./dirdat/trace/hzss/p_emr/la012279, which is not marked as complete; but succeeding trail file ./dirdat/trace/hzss/p_emr/la012280 exists. If ALTER ETROLLOVER has been performed on source extract, ALTER EXTSEQNO must be performed on each corresponding
  downstream reader.

原因是由於源端到目標端的網路中斷,導致 datapump 投遞程式 abended

解決方法:

源端的投遞程式產生新的檔案點:
  GGSCI (oggdb01) 3> alter extract p_emr etrollover
  2015-04-30 12:47:24  INFO    OGG-01520  Rollover performed.  For each affected output trail of Version 10 or higher format, after starting the source extract, issue ALTER EXTSEQNO for that trail's reader (either pump EXTRACT or REPLICAT) to move the reader's scan to the new trail file;  it will not happen automatically.
  EXTRACT altered.
  GGSCI (oggdb01) 4> start p_emr
 
目標端的 replicat 複製程式從新的序列號開始( la012280
  GGSCI (localhost) 3> stop hzss-r2
  GGSCI (localhost) 4> alter replicat hzss-r2 extseqno 12280 extrba 0
  GGSCI (localhost) 5> start hzss-r2

 

2. 處理不同步的表
先停掉目標端的 replicat 複製程式(確保 scn 號一致)
從源端按 SCN 號匯出不同步的表:

expdp system/oracle directory=dmpdir dumpfile=zjhis_tab20150522.dmp logfile=zjhis_tab20150522.log tables=zjhis.CF_DUOMEITI,zjhis.CF_XIANGMUZD,zjhis.YZ_INPATIENT_ORDER flashback_scn = 12585744134590

 

dmp 檔案匯入到目標端 :

impdp system/oracle directory=dmpdir dumpfile=zjhis_tab20150522.dmp logfile=impdp20150522.log 
  remap_schema=zjhis:sq_zjhis  table_exists_action=replace

replicat 複製程式裡新增如下引數:
  map zjhis.CF_DUOMEITI, target sq_zjhis.CF_DUOMEITI, filter (@GETENV ("transaction", "csn") > 12585744134590);
  map zjhis.CF_XIANGMUZD, target sq_zjhis.CF_XIANGMUZD, filter (@GETENV ("transaction", "csn") > 12585744134590);
  map zjhis.YZ_INPATIENT_ORDER, target sq_zjhis.YZ_INPATIENT_ORDER, filter (@GETENV ("transaction", "csn") > 12585744134590);

 

3. 源端啟動 datapump 投遞程式時,報錯如下:

2015-11-23 20:28:58  ERROR   OGG-01031  There is a problem in network communication, a remote file problem, encryption keys for target and source do not match (if using ENCRYPT) or an unknown error. (Reply received is Unable to open file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable)).

大概意思如下:
網路通訊中存在一個問題,一個遠端檔案問題,目標和源的加密金鑰不匹配(如果使用加密)或一個未知的錯誤。(收到的回覆是無法開啟的檔案 “/opt/app/ogg/dirdat/trace/his/la000951”   error 11, 資源暫時不可用))

 

檢視目標端的 ggserr.log 檔案,在出錯的時間段內   檢索 la000951 檔案,發現如下比較明顯的資訊:

2015-11-23 13:30:49  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to lock file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).  Lock currently held by process id (PID) 26115.
  2015-11-23 13:34:46  INFO    OGG-01669  Oracle GoldenGate Collector for Oracle:  Opening /opt/app/ogg/dirdat/trace/his/la000951 (byte -1, current EOF 1194).
  2015-11-23 13:34:56  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to lock file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).  Lock currently held by process id (PID) 26115.
  2015-11-23 13:34:56  WARNING OGG-01223  Oracle GoldenGate Collector for Oracle:  Unable to open file "/opt/app/ogg/dirdat/trace/his/la000951" (error 11, Resource temporarily unavailable).

原因是源端的 datapump 程式要往目標端的第 951 trail 檔案寫資料,而此時目標端的該檔案被編號為 26115 的系統程式所鎖定,造成源端無法開啟檔案而 abended

 

解決:
查詢到該系統程式, kill 掉。最終重新啟動 pump 程式成功。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23732248/viewspace-2757976/,如需轉載,請註明出處,否則將追究法律責任。

相關文章