因機房停電,導致帶庫的Library離線,TSM的介質變換器不正常,導致不能備份

mengzhaoliang發表於2009-09-24

環境:
1、 Windows 2003 的Tivoli Storage Manager5.4.0.0
2、 AIX5.3上的Oracle10.2.0.1.0
3、 IBM的SCSI 3310LIB 的帶庫


因為機房停電的緣故,發現不能正常備份。
1、檢視TSM日誌:
LHXXTSM01 IBM Tivoli Storage Manager
LHXXTSM01 Command Line Administrative Interface - Version 5, Release 3, Level 2.0
LHXXTSM01 (c) Copyright by IBM Corporation and other(s) 1990, 2005. All Rights Reserved.
LHXXTSM01 
LHXXTSM01 ANS8023E Unable to establish session with server.
LHXXTSM01 
LHXXTSM01 ANS8002I Highest return code was 137.
LHXXTSM01 
LHXXTSM01 ANS1051I Invalid password

連線不上伺服器

2、檢視RMAN的備份日誌
channel t1: starting piece 1 at 20-SEP-09
released channel: t1
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03009: failure of backup command on t1 channel at 09/20/2009 16:05:35
ORA-27192: skgfcls: sbtclose2 returned error - failed to close file
ORA-19511: Error received from media manager layer, error text:
   ANS1312E (RC12)   Server media mount not possible

Recovery Manager complete.


3、檢視3100帶庫的Library、Driver是否正常。
登陸帶庫的WEB介面檢視,Driver是處於ONLINE狀態,屬於正常狀態。
而Library是處於OFFLINE狀態,不正常狀態。
使Library處於ONLINE狀態。
然後重起帶庫,沒有發現錯誤的日誌。

4、在重新啟動Tivoli Storage Manager服務時,發現下面的錯誤日誌:

日期/時間: 09/23/2009 16:00:44
      訊息: ANR8300E 庫 3310LIB 上的 I/O 錯誤(OP=8401C08C,CC=210,KEY=FF,ASC=FF,ASCQ=FF, SENSE=**NONE**, 描述=由於裝置上電、SCSI 匯流排復位或手動地將磁帶裝入/彈出,而導致裝置復位。)。請參見“訊息”手冊中的附錄 C 以獲取建議的操作。 (會話: 12)

日期/時間: 09/23/2009 16:00:44
      訊息: ANR8441E SCSI 庫 3310LIB 的初始化失敗。 (會話: 12)

日期/時間: 09/23/2009 16:00:44
      訊息: ANR1401W 卷 Z16045L3 的安裝請求被拒絕 - 安裝失敗。 (會話: 12)

5、檢查帶庫正常的情況下,在WINDOWS的裝置管理器中,檢查CHANGER(介質變換器) 及 DRIVE(磁帶驅動)的狀態和驅動是否正確
發現下面的情況:
兩個磁帶驅動器是一樣的,都正常狀態:
名稱1、:IBM ULT3580-TD3 SCSI Sequential Device
名稱2、:IBM ULT3580-TD3 SCSI Sequential Device

而介質變換器,有一個不正常:
介質變換器:
1、IBM TotalStorage 3576 Modular Tape Library  (狀態正常)
2、Unknown Medium Chaner

把第二個介質變換器的驅動重新安裝,變成下面這樣則好了。
介質變換器:
1、IBM TotalStorage 3576 Modular Tape Library  (狀態正常)
2、IBM TotalStorage 3576 Modular Tape Library  (狀態正常)


6、 然後關閉TSM服務,重新啟動。檢視TSM的日誌已經正常
7、 到資料庫(或者TSM的Client端)中kill tsm的排程程式,然後重新啟動該排程程式則可。

檢視tsm備份的排程程式:LHXXDBS01:oraoms> ps -ef|grep dsm
2、殺死排程程式:
LHXXDBS01:/> kill 860334
3、重新啟動排程程式:
LHXXDBS01:/usr/tivoli/tsm/script> ./oraclebcksched.sh &
[1]     340154
LHXXDBS01:/usr/tivoli/tsm/script>

 


備份已經正常。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/12778571/viewspace-615485/,如需轉載,請註明出處,否則將追究法律責任。

相關文章