因機房停電,導致帶庫的Library離線,TSM的介質變換器不正常,導致不能備份
環境:
1、 Windows 2003 的Tivoli Storage Manager5.4.0.0
2、 AIX5.3上的Oracle10.2.0.1.0
3、 IBM的SCSI 3310LIB 的帶庫
因為機房停電的緣故,發現不能正常備份。
1、檢視TSM日誌:
LHXXTSM01 IBM Tivoli Storage Manager
LHXXTSM01 Command Line Administrative Interface - Version 5, Release 3, Level 2.0
LHXXTSM01 (c) Copyright by IBM Corporation and other(s) 1990, 2005. All Rights Reserved.
LHXXTSM01
LHXXTSM01 ANS8023E Unable to establish session with server.
LHXXTSM01
LHXXTSM01 ANS8002I Highest return code was 137.
LHXXTSM01
LHXXTSM01 ANS1051I Invalid password
連線不上伺服器
2、檢視RMAN的備份日誌
channel t1: starting piece 1 at 20-SEP-09
released channel: t1
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03009: failure of backup command on t1 channel at 09/20/2009 16:05:35
ORA-27192: skgfcls: sbtclose2 returned error - failed to close file
ORA-19511: Error received from media manager layer, error text:
ANS1312E (RC12) Server media mount not possible
Recovery Manager complete.
3、檢視3100帶庫的Library、Driver是否正常。
登陸帶庫的WEB介面檢視,Driver是處於ONLINE狀態,屬於正常狀態。
而Library是處於OFFLINE狀態,不正常狀態。
使Library處於ONLINE狀態。
然後重起帶庫,沒有發現錯誤的日誌。
4、在重新啟動Tivoli Storage Manager服務時,發現下面的錯誤日誌:
日期/時間: 09/23/2009 16:00:44
訊息: ANR8300E 庫 3310LIB 上的 I/O 錯誤(OP=8401C08C,CC=210,KEY=FF,ASC=FF,ASCQ=FF, SENSE=**NONE**, 描述=由於裝置上電、SCSI 匯流排復位或手動地將磁帶裝入/彈出,而導致裝置復位。)。請參見“訊息”手冊中的附錄 C 以獲取建議的操作。 (會話: 12)
日期/時間: 09/23/2009 16:00:44
訊息: ANR8441E SCSI 庫 3310LIB 的初始化失敗。 (會話: 12)
日期/時間: 09/23/2009 16:00:44
訊息: ANR1401W 卷 Z16045L3 的安裝請求被拒絕 - 安裝失敗。 (會話: 12)
5、檢查帶庫正常的情況下,在WINDOWS的裝置管理器中,檢查CHANGER(介質變換器) 及 DRIVE(磁帶驅動)的狀態和驅動是否正確
發現下面的情況:
兩個磁帶驅動器是一樣的,都正常狀態:
名稱1、:IBM ULT3580-TD3 SCSI Sequential Device
名稱2、:IBM ULT3580-TD3 SCSI Sequential Device
而介質變換器,有一個不正常:
介質變換器:
1、IBM TotalStorage 3576 Modular Tape Library (狀態正常)
2、Unknown Medium Chaner
把第二個介質變換器的驅動重新安裝,變成下面這樣則好了。
介質變換器:
1、IBM TotalStorage 3576 Modular Tape Library (狀態正常)
2、IBM TotalStorage 3576 Modular Tape Library (狀態正常)
6、 然後關閉TSM服務,重新啟動。檢視TSM的日誌已經正常
7、 到資料庫(或者TSM的Client端)中kill tsm的排程程式,然後重新啟動該排程程式則可。
檢視tsm備份的排程程式:LHXXDBS01:oraoms> ps -ef|grep dsm
2、殺死排程程式:
LHXXDBS01:/> kill 860334
3、重新啟動排程程式:
LHXXDBS01:/usr/tivoli/tsm/script> ./oraclebcksched.sh &
[1] 340154
LHXXDBS01:/usr/tivoli/tsm/script>
備份已經正常。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/12778571/viewspace-615485/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- TSM配置不好導致備份不正常,從而導致資料庫效能問題資料庫
- 帶庫只有一盤磁帶,TSM的儲存池達到100%導致備份不正常
- 5.9 TSM的客戶端(ORACLE資料庫)排程程式不能啟動導致備份不正常客戶端Oracle資料庫
- TSM備份時因歸檔日誌丟失而導致備份失敗
- 因AIX系統目錄許可權問題導致TSM備份失敗AI
- 導致物聯網路卡停機的原因
- 核心引數導致的備庫當機分析
- 故障分析 | DDL 導致的 Xtrabackup 備份失敗
- mysql主鍵的缺少導致備庫hangMySql
- 一次因為修改環境變數導致RESIN不能啟動的問題變數
- 大量"library cache lock"事件導致資料庫無法連線事件資料庫
- 【Mysql】mysql主鍵的缺少導致備庫hangMySql
- 記錄一次停電導致的資料庫不完全恢復資料庫
- Git因換行符不一致導致反覆有修改記錄Git
- 停電導致aix檔案系統掛載問題AI
- MySQL 5.6因為OOM導致資料庫重啟MySqlOOM資料庫
- ORACLE windows伺服器斷電重啟後計劃任務變更導致rman備份中斷OracleWindows伺服器
- Oracle RAC啟動因CTSS導致的異常Oracle
- 【恢復】使用控制檔案的trace備份恢復因異常斷電導致所有控制檔案損壞的資料庫故障資料庫
- TSM Server的密碼過期,導致不能使用Management Console中的命令列Server密碼命令列
- Oracle備份與恢復系列 (二)停機一致性備份Oracle
- WGCLOUD分散式監控平臺:導致agent主機下線離線的原因整理GCCloud分散式
- 10G rac 因為ocr原因導致crs不能啟動的排查二例
- ASM磁碟組故障導致資料庫不能起來ASM資料庫
- 記一次,因表變數導致SQL執行效率變慢變數SQL
- 伺服器磁碟離線導致RAIDZ崩潰資料恢復伺服器AI資料恢復
- 一個RMAN備份時導致系統慢解決的案例
- 飛機導航系統遭攻擊!致多架飛機偏離航線
- 故障分析 | replace into 導致主備不一致
- 故障分析 | 血的教訓-由慢查詢引發的備份等待導致資料庫連線打滿資料庫
- IBM HA雙機光交鏈路問題導致的oracle資料庫exp備份問題IBMOracle資料庫
- archivelog滿了導致資料庫怠機的solutionHive資料庫
- 《連線》:智慧手機導致近視人群增多
- 【RMAN】“壞塊”導致RMAN備份不成功的RMAN處理方法
- LOG_ARCHIVE_MAX_PROCESSES=30導致資料庫啟停都很慢Hive資料庫
- Raid5兩塊硬碟離線導致伺服器癱瘓的解決方法AI硬碟伺服器
- rman備份的時候讀取v$session_longops失敗導致備份失敗SessionGo
- 導致IP被封的原因