UNDO表空間資料檔案丟失處理(一)預備知識
場景描述:
在undo表空間丟失後,可能導致資料庫無法啟動。在解決了undo資料檔案丟失後做了一個總結。
已知無法啟動的場景:
當有事務沒有提交,然後異常停止資料庫(shutdown abort或伺服器停機),會導致資料庫無法啟動。
說明:在oracle11.2.0.3上做的驗證。預備知識
1 block校驗
1.1 checksum校驗
將資料塊以雙位元組分組,進行異或運算,所得的值為0,則滿足checksum校驗。如果不為0則表示該塊有問題。
當對資料塊進行修改後,需要重新調整,使checksum為0。
調整方法:
先計算checksum,然後和chkval_kcbh進行異或,並將值賦給chkval_kcbh。
[oracle@testlfy ~]$ bbed filename='/opt/oracle/oradata/orcl/system01.dbf' password=blockedit mode=edit BBED: Release 2.0.0.0.0 - Limited Production on Fri Feb 28 01:41:53 2014 Copyright (c) 1982, 2011, Oracle and/or its affiliates. All rights reserved. ************* !!! For Oracle Internal Use only !!! *************** BBED> set block 225 BLOCK# 225
BBED> p kcbh struct kcbh, 20 bytes @0 ub1 type_kcbh @0 0x06 ub1 frmt_kcbh @1 0xa2 ub1 spare1_kcbh @2 0x00 ub1 spare2_kcbh @3 0x00 ub4 rdba_kcbh @4 0x004000e1 ub4 bas_kcbh @8 0x0010abf2 ub2 wrp_kcbh @12 0x0000 ub1 seq_kcbh @14 0x01 ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV) ub2 chkval_kcbh @16 0x8724 ub2 spare3_kcbh @18 0x0000
BBED> p kcbh.chkval_kcbh ub2 chkval_kcbh @16 0x8724
BBED> dump File: /opt/oracle/oradata/orcl/system01.dbf (0) Block: 225 Offsets: 16 to 527 Dba:0x00000000 ------------------------------------------------------------------------ 24870000 01000000 0f000000 f1ab1000 00000000 01f80300 00000000 00002100 18000000 25024000 22000f00 01200000 f2ab1000 00011500 02003c00 fa0f811c 811c0000 15008e1f fb100300 04000500 06000700 08000900 0a00ffff fa0f3b10 ae157115 2f15ed14 ab146914 2714ebytes per line>
BBED> m /x 2488 File: /opt/oracle/oradata/orcl/system01.dbf (0) Block: 225 Offsets: 16 to 527 Dba:0x00000000 ------------------------------------------------------------------------ 24880000 01000000 0f000000 f1ab1000 00000000 01f80300 00000000 00002100 18000000 25024000 22000f00 01200000 f2ab1000 00011500 02003c00 fa0f811c 811c0000 15008e1f fb100300 04000500 06000700 08000900 0a00ffff fa0f3b10 ae157115 2f15ed14 ab146914 2714ebytes per line>
BBED> p kcbh.chkval_kcbh ub2 chkval_kcbh @16 0x8724 |
如果通過bbed,在修改完成後,直接執行sum apply是checksum校驗。
BBED> sum apply Check value for File 0, Block 225: current = 0x8724, required = 0x8724 |
1.2 tailchk校驗
tailchk = kcbh.bas_kcbh(後四位)+ kcbh.type_kcbh + kcbh.seq_kcbh
BBED> p tailchk ub4 tailchk @8188 0xabf20601
BBED> p kcbh struct kcbh, 20 bytes @0 ub1 type_kcbh @0 0x06 ub1 frmt_kcbh @1 0xa2 ub1 spare1_kcbh @2 0x00 ub1 spare2_kcbh @3 0x00 ub4 rdba_kcbh @4 0x004000e1 ub4 bas_kcbh @8 0x0010abf2 ub2 wrp_kcbh @12 0x0000 ub1 seq_kcbh @14 0x01 ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV) ub2 chkval_kcbh @16 0x8724 ub2 spare3_kcbh @18 0x0000 |
1.3 事務校驗
事務校驗主要關注ITL槽位狀態和資料行lock狀態。
ITL槽事務狀態
BBED> p ktbbh struct ktbbh, 72 bytes @20 ub1 ktbbhtyp @20 0x01 (KDDBTDATA) union ktbbhsid, 4 bytes @24 ub4 ktbbhsg1 @24 0x0000004a ub4 ktbbhod1 @24 0x0000004a struct ktbbhcsc, 8 bytes @28 ub4 kscnbas @28 0x0010b84e ub2 kscnwrp @32 0x0000 sb2 ktbbhict @36 2 ub1 ktbbhflg @38 0x02 (NONE) ub1 ktbbhfsl @39 0x00 ub4 ktbbhfnx @40 0x00000000 struct ktbbhitl[0], 24 bytes @44 struct ktbitxid, 8 bytes @44 ub2 kxidusn @44 0x0001 ub2 kxidslt @46 0x000b ub4 kxidsqn @48 0x0000026b struct ktbituba, 8 bytes @52 ub4 kubadba @52 0x014001a7 ub2 kubaseq @56 0x007d ub1 kubarec @58 0x37 ub2 ktbitflg @60 0x8000 (KTBFCOM) union _ktbitun, 2 bytes @62 sb2 _ktbitfsc @62 0 ub2 _ktbitwrp @62 0x0000 ub4 ktbitbas @64 0x0010afe9 struct ktbbhitl[1], 24 bytes @68 struct ktbitxid, 8 bytes @68 ub2 kxidusn @68 0x0001 ub2 kxidslt @70 0x001b ub4 kxidsqn @72 0x00000271 struct ktbituba, 8 bytes @76 ub4 kubadba @76 0x0140042d ub2 kubaseq @80 0x0092 ub1 kubarec @82 0x03 ub2 ktbitflg @84 0x2001 (KTBFUPB) union _ktbitun, 2 bytes @86 sb2 _ktbitfsc @86 0 ub2 _ktbitwrp @86 0x0000 ub4 ktbitbas @88 0x0010b84f |
ktbitflg說明:
前4個bit的含義
KTBFCOM BIT 0x8000 transaction is committed
KTBFIBI BIT 0x4000 rollback of this uba gives a BI of the itl
KTBFUPB BIT 0x2000 commit time is upper bound
* For a cleaned-out committed itl, 0x2000 indicates the commit time is an upperbound time.
* For a uncleaned-out active itl, 0x2000 indicates that the itl has been delayed-logged cleaned out with an scn base set, row locks are not cleared
KTBFTAC BIT 0x1000 this xac is active as of ktbbhcsc
前四個bit都為0,表示事務是活動的,或延遲清理的。
剩下的12bit表示被鎖定的行數
KTBFLKC BIT 0x0FFF lock count mask for flag
行事務狀態
在2c後面的位元組就是行上的ITL操作,ITL槽上狀態置為提交時,這個標記為要置為0。
BBED> p *kdbr[10] rowdata[6616] ------------- ub1 rowdata[6616] @7485 0x2c
BBED> dump File: /opt/oracle/oradata/orcl/system01.dbf (0) Block: 665 Offsets: 7485 to 7996 Dba:0x00000000 ------------------------------------------------------------------------ 2c000a03 c2052502 c10202c1 020fce64 64646464 64646464 64646464 64018001 8002c115 02c10220 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 01802c00 0a03c205 1302c102 02c1020f ce646464 64646464 64646464 64646401 8002c102 02c11502 c102202d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d01 802c000a 03c2043f 02c10202 c10202c5 1502c102 018002c3 0204c304 011e202d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d01 802c000a 03c2043d 02c10202 c1020fce 64646464 64646464 64646464 64640180 02c10202 c11503c2 0c12202d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d01 802c000a 03c2040b 02c10201 800fce64 64646464 64646464 64646464 64018002 c10202c1 0b02c102 202d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d01802c 000a03c2 035c02c1 0202c102 05c4051e 324402c1 02018002 c30204c3 02010220 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 01802c00 0a03c203 5802c102 02c10206 c50a6464 646402c1 02018002 c11502c1 04202d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d2d2d 2d2d0180 2c000a03 c2035702 c1020180 0fce6464
<32 bytes per line>
BBED> |
1.4 壞塊標識
在塊頭中,seq_kcbh(佔用1位元組,塊頭偏移14)有著特殊的含義,如果該值為0xff,則表示該塊被標記為corruption。
查詢資料庫壞塊
select * from v$database_block_corruption; |
2 回滾段
2.1 回滾段資訊
SQL> desc undo$ Name Null? Type ----------------------------------------- -------- ---------------------------- US# NOT NULL NUMBER NAME NOT NULL VARCHAR2(30) USER# NOT NULL NUMBER FILE# NOT NULL NUMBER BLOCK# NOT NULL NUMBER SCNBAS NUMBER SCNWRP NUMBER XACTSQN NUMBER UNDOSQN NUMBER INST# NUMBER STATUS$ NOT NULL NUMBER TS# NUMBER UGRP# NUMBER KEEP NUMBER OPTIMAL NUMBER FLAGS NUMBER SPARE1 NUMBER SPARE2 NUMBER SPARE3 NUMBER SPARE4 VARCHAR2(1000) SPARE5 VARCHAR2(1000) SPARE6 DATE |
Status值說明:
1 = INVALID
2 = AVAILABLE
3 = IN USE
4 = OFFLINE
5 = NEED RECOVERY
6 = PARTLY AVAILABLE (contains in-doubt txs)
當出現刪除回滾表空間,出現錯誤提示“ORA-01548: active rollback segment '_SYSSMU1_1240252155$' found, terminate”,可以將status修改為1。將回滾段置為非法狀態。這樣再配合其他操作,可以刪除回滾表空間。
2.2 查詢回滾段所在資料塊
要想刪除回滾段狀態,需要知道回滾段儲存的位置。
通過查詢SQL,可以知道rollback segment所在的資料塊。
select t.name, t.status$, t.file#, t.block#, dbms_rowid.rowid_relative_fno(rowid) file#, dbms_rowid.rowid_block_number(rowid) blk# from undo$ t where file# = 3; |
3 跟蹤不能啟動過程
通過下面的命令,生成跟蹤檔案,在檔案中查詢資料庫不能正常啟動的原因。
startup mount oradebug setmypid oradebug EVENT 10046 TRACE NAME CONTEXT FOREVER, LEVEL 12 oradebug TRACEFILE_NAME alter database open; |
一般不能啟動,原因是事務沒有完成
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/720091/viewspace-1096615/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- UNDO表空間資料檔案丟失處理(二)正常關閉資料庫資料庫
- oracle中undo表空間丟失處理方法Oracle
- undo表空間檔案丟失恢復(1)--有備份
- 關於丟失表空間資料檔案的處理方式
- 新建的表空間(或資料檔案)丟失以及控制檔案丟失,有新建表空間(或資料檔案)前的控制文
- 撤消表空間資料檔案丟失的恢復.
- 表空間資料檔案故障處理
- ORACLE 回滾段表空間資料檔案丟失或損壞處理方法(1) (轉)Oracle
- undo表空間故障處理
- . 資料庫臨時表空間的資料檔案的丟失資料庫
- 【RMAN】SYSTEM表空間資料檔案丟失恢復模擬
- UNDO表空間下的資料檔案被誤刪除後的處理方法
- undo表空間檔案丟失恢復(2)--無備份有redo的情況下恢復
- undo表空間檔案丟失恢復(3)--無備份無redo的情況下恢復
- undo表空間檔案丟失恢復(4)--無備份無recover的情況下恢復
- Oracle undo 表空間資料檔案丟失強制啟動資料庫(沒有未提交的事務)Oracle資料庫
- 基礎知識5——表空間和資料檔案
- 當資料檔案表空間丟失的時候怎麼恢復該資料檔案
- UNDO表空間損壞的處理
- 使用中undo表空間資料檔案被誤刪
- undo表空間佔用磁碟空間滿案例處理
- 備份與恢復系列 九 丟失表空間資料檔案的還原與恢復
- undo 表空間滿了的處理方法
- 控制檔案丟失處理方法
- Oracle undo表空間爆滿的處理方法Oracle
- undo表空間損壞的處理過程
- undo檔案丟失或損壞
- INDEX表空間檔案丟失或者損壞的恢復Index
- redo log檔案丟失處理措施
- rman備份但丟失一個資料檔案,但有歸檔備份
- 系統表空間資料檔案丟失,無備份,無重啟,通過控制程式碼恢復
- 恢復案例:歸檔模式下丟失非系統表空間資料檔案的恢復模式
- 只讀表空間的恢復問題--預備知識
- MySQL 磁碟空間滿導致表空間相關資料檔案損壞故障處理MySql
- 【知識分享】如何預防伺服器資料丟失伺服器
- 備份恢復之資料檔案丟失
- dataguard之物理備庫丟失資料檔案
- 改變資料庫undo表空間資料庫