Oracle備份與恢復案例

luckyfriends發表於2013-02-27

文件既有概念,又有小實驗,之前自己整理過備份和恢復的PPT,和這個文章思路和實驗差不多,本來想搬到網上,懶得整理,正好這個文件基本上介紹到了,從冷備及其恢復(資料檔案、表空間等的恢復)以及RMAN恢復,梳理思路概念來說挺有用的。

備份與恢復案例

By Piner

http://epub.itpub.net/5/1.htm

 

理解什麼是資料庫恢復
   
當我們使用一個資料庫時,總希望資料庫的內容是可靠的、正確的,但由於計算機系統的故障(硬體故障、軟體故障、網路故障、程式故障和系統故障)影響資料庫系統的操作,影響資料庫中資料的正確性,甚至破壞資料庫,使資料庫中全部或部分資料丟失。因此當發生上述故障後,希望能重構這個完整的資料庫,該處理稱為資料庫恢復。恢復過程大致可以分為復原(Restore)與恢復(Recover)過程。

 

資料庫恢復可以分為以下兩類:

 

1.1例項故障的一致性恢復

當例項意外地(如掉電、後臺程式故障等)或預料地(發出SHUTDOUM ABORT語句)中止時出現例項故障,此時需要例項恢復。例項恢復將資料庫恢復到故障之前的事務一致狀態。如果在線上後備發現例項故障,則需介質恢復。在其它情況Oracle在下次資料庫起動時(對新例項裝配和開啟),自動地執行例項恢復。如果需要,從裝配狀態變為開啟狀態,自動地激發例項恢復,由下列處理:

  (1 為了解恢復資料檔案中沒有記錄的資料,進行向前滾。該資料記錄在線上日誌,

包括對回滾段的內容恢復。

  (2 回滾未提交的事務,按步1重新生成回滾段所指定的操作。

  (3 釋放在故障時正在處理事務所持有的資源。

  (4 解決在故障時正經歷一階段提交的任何懸而未決的分佈事務。


1.2
介質故障或檔案錯誤的不一致恢復

介質故障是當一個檔案、一個檔案的部分或磁碟不能讀或不能寫時出現的故障。檔案錯誤一般指意外的錯誤導致檔案被刪除或意外事故導致檔案的不一致。這種狀態下的資料庫都是不一致的,需要DBA手工來進行資料庫的恢復,這種恢復有兩種形式,決定於資料庫執行的歸檔方式和備份方式。

 

1 完全介質恢復可恢復全部丟失的修改。一般情況下需要有資料庫的備份且資料庫執行在歸檔狀態下並且有可用歸檔日誌時才可能。對於不同型別的錯誤,有不同型別的完全恢復可使用,其決定於毀壞檔案和資料庫的可用性。

 

2 不完全介質恢復是在完全介質恢復不可能或不要求時進行的介質恢復。重構受損的資料庫,使其恢復介質故障前或使用者出錯之前的一個事務一致性狀態。不完全介質恢復有不同型別的使用,決定於需要不完全介質恢復的情況,有下列型別:基於撤消、基於時間和基於修改的不完全恢復。

  基於撤消(CANCEL)恢復:在某種情況,不完全介質恢復必須被控制,DBA可撤消在指定點的操作。基於撤消的恢復地在一個或多個日誌組(線上的或歸檔的)已被介質故障所破壞,不能用於恢復過程時使用,所以介質恢復必須控制,以致在使用最近的、未損的日誌組於資料檔案後中止恢復操作。

 

  基於時間(TIME)和基於修改(SCN)的恢復:如果DBA希望恢復到過去的某個指定點,是一種理想的不完全介質恢復,一般發生在恢復到某個特定操作之前,恢復到如意外刪除某個資料表之前。

 

第二章資料庫恢復案例測試環境


2.1 
資料庫環境

以下的所有案例都是透過測試經過,環境為:

  OSWindows 2000 Server

  DBOracle 816

  DBNAMETEST

資料檔案:

SQL> select file#,status,enabled,name from v$datafile;

 

    FILE# STATUS  ENABLED      NAME

----------------------------------------------------------------

         1 SYSTEM  READ WRITE D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

         2 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\RBS01.DBF

         3 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\USERS01.DBF

         4 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\TEMP01.DBF

         5 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\TOOLS01.DBF

         6 ONLINE  READ WRITE D:\Oracle\ORADATA\TEST\INDX01.DBF

控制檔案:

SQL> select * from v$controlfile;

 

STATUS  NAME

---------------------------------------------------------------------

        D:\Oracle\ORADATA\TEST\CONTROL01.CTL

        D:\Oracle\ORADATA\TEST\CONTROL02.CTL

        D:\Oracle\ORADATA\TEST\CONTROL03.CTL


聯機日誌:

SQL> select * from v$logfile;

 

    GROUP# STATUS      MEMBER

---------------------------------------------------------------------

      1     STALE      D:\Oracle\ORADATA\TEST\REDO01.LOG

      2               D:\Oracle\ORADATA\TEST\REDO02.LOG

      3     STALE      D:\Oracle\ORADATA\TEST\REDO03.LOG

 

2.2 資料庫備份指令碼

冷備份指令碼:

rem     script.:coldbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:offline full backup database

 

--connect database

connect internal/password;

--shutdown database

shutdown immediate;

--Copy Data file

!xcopy d:\Oracle\oradata\test\*.dbf d:\database/H/R;

--Copy Control file

!xcopy d:\Oracle\oradata\test\*.ctl d:\database/H/R;

--Copy Log file

!xcopy d:\Oracle\oradata\test\*.log d:\database/H/R;

--startup database

startup;

 

說明:

1、以上指令碼在資料庫關閉狀態下備份資料庫所有的資料檔案,聯機日誌,控制檔案(在一個目

錄下),如果成功備份,所有檔案是一致的;

2、沒有備份引數檔案,引數檔案可以另外備份,沒有必要每次都備份,只需要在改變設定後備份一次;

3、如果以上命令沒有成功依次執行,那麼備份將是無效的,如連線資料庫不成功,那麼肯定關閉資料庫也不成功,那麼備份則無效;

4、冷備份建議下人工干預下執行。

 

資料庫OS熱全備份指令碼

rem     script.:hotbak.sql

rem     creater:chenjiping

rem     date:5.8.2003

rem     desc:backup all database datafile in archive

 

--connect database

connect internal/password;

 

--archive

alter system archive log current;

--start

 

alter tablespace system begin backup;

!xcopy d:\Oracle\oradata\test\system01.dbf d:\databak/H/R;

alter tablespace system end backup;

 

alter tablespace rbs begin backup;

!xcopy d:\Oracle\oradata\test\rbs01.dbf d:\databak/H/R;

alter tablespace rbs end backup;

 

alter tablespace users begin backup;

!xcopy d:\Oracle\oradata\test\users01.dbf d:\databak/H/R;

alter tablespace users end backup;

 

alter tablespace tools begin backup;

!xcopy d:\Oracle\oradata\test\tools01.dbf d:\databak/H/R;

alter tablespace tools end backup;

 

alter tablespace indx begin backup;

!xcopy d:\Oracle\oradata\test\indx01.dbf d:\databak/H/R;

alter tablespace indx end backup;

--end

 

--bak control file

--binary

alter database backup controlfile to 'd:\databak\controlbinbak.000';

--ascii

alter database backup controlfile to trace;

 

alter system archive log current;

說明:

1、熱備份必須在資料庫歸檔方式下才可以執行;

2、以上指令碼可以在資料庫執行狀態下備份資料庫所有的資料檔案(除了臨時資料檔案),沒有必要備份聯機日誌;

3、歸檔日誌至少需要一次完整備份之後的所有日誌;

4、如果以上命令沒有成功依次執行,那麼備份也是無效的,如連線資料庫不成功,那麼備份則無效。

 

RMAN備份只講敘有恢復目錄的情況,如果沒有恢復目錄,情形大致相似。以下是RMAN的熱備份全備份的指令碼:

#   script.:bakup.rcv

#   creater:chenjiping

#   date:5.8.2003

#   desc:backup all database datafile in archive with rman

 

# connect database

connect rcvcat rman/rman@back;

connect target internal/virpure;

 

# start backup database

run{

allocate channel c1 type disk;

backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

include current controlfile;

sql 'alter system archive log current';

release channel c1;

}

# end

 

說明:

1 資料庫必須執行在歸檔模式下;

2 RMAN將自動備份資料檔案,執行可靠;

3 歸檔日誌另外備份處理,但至少需要儲存一次備份來的日誌;

4 沒有必要用RMAN做冷備份,效果不好。

 

以上舉例說明了資料庫的恢復案例的測試環境與部分備份測試指令碼,其它的備份指令碼可以根據以上指令碼演變而來或在案例中加以說明。

資料庫的自動例項將不加以說明,這裡只舉例說明媒體錯誤或人為錯誤造成的恢復可能。

以上包括以下案例都是在WINDOWS+Oracle816上測試驗證的,在不同的作業系統與不同的資料庫版本中略有差別。

 

第三章瞭解與恢復相關的資訊

 

1 理解報警日誌檔案

報警日誌檔案一般記載了資料庫的啟動/關閉資訊,歸檔資訊,備份資訊,恢復資訊,常見錯誤資訊,部分資料庫修改記錄等。一般令名規則為Alrt.logAlrt.log,如我的測試資料庫的報警日誌檔案的名稱為testalrt.log

 

報警日誌檔案的路徑是根據初始化引數background_dump_dest來決定的,如在我的機器上,該引數值為 D:\Oracle\admin\test\bdump,那麼,你就可以在該路徑下找到該檔案。

2 後臺程式跟蹤檔案

後臺程式跟蹤檔案的路徑與報警日誌檔案的路徑一致,在某些情況下,你可以透過後臺跟蹤檔案的資訊瞭解更多的需要恢復的資訊。如在資料庫需要恢復的時候,報警日誌檔案中常有這樣的語句:

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

透過提示的DBWR跟蹤檔案,可以查詢到更詳細的資訊。


3
 v$recover_filev$recovery_log

這是兩個動態效能檢視,可以在mount下檢視,透過這兩個檢視,你可以瞭解詳細的需要恢復的資料檔案與需要使用到的歸檔日誌。

第四章資料庫恢復案例


4.1
非歸檔模式下的備份與恢復

備份方案:採用OS冷備份

 

1.  連線資料庫並建立測試表

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2.  備份資料庫

SQL> @coldbak.sql 或在DOS svrmgrl @coldbak.sql

 

3.  再插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

-------------------

                         1

                         2

4.  關閉資料庫

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5.  毀壞一個或多個資料檔案,如刪除user01.dbf

C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF

模擬媒體毀壞。

 

6.  重新啟動資料庫,會發現如下錯誤

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

 

在報警檔案中,會有更詳細的資訊

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

7.  複製備份復原到原來位置(restore過程)

C:\>xcopy d:\database\*.* d:\Oracle\oradata\test/H/R/S

 

8.  開啟資料庫,檢查資料

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

 

這裡可以發現,資料庫恢復成功,但在備份之後與崩潰之前的資料丟失了。

說明:

1、非歸檔模式下的恢復方案可選性很小,一般情況下只能有一種恢復方式,就是資料庫的冷備
份的完全恢復,僅僅需要複製原來的備份就可以(restore),不需要recover

2、這種情況下的恢復,可以完全恢復到備份的點上,但是可能是丟失資料的,在備份之後與崩潰之前的資料將全部丟失;

3、不管毀壞了多少資料檔案或是聯機日誌或是控制檔案,都可以透過這個辦法恢復,因為這個恢復過程是Restore所有的冷備份檔案,而這個備份點上的所有檔案是一致的,與最新的資料庫沒有關係,就好比把資料庫又放到了一個以前的""上;

4、對於非歸檔模式下,最好的辦法就是採用OS的冷備份,建議不要用RMAN來作冷備份,效果不好,因為RMAN不備份聯機日誌,restore不能根本解決問題;

5、如果沒有備份聯機日誌,如RMAN的備份,就需要利用不完全恢復(until cancel)的方法來重新建立聯機日誌檔案。

4.2歸檔模式下丟失或損壞一個資料檔案

4.2.1 OS備份方案

在歸檔方式下損壞或丟失一個資料檔案,如果存在相應的備份與該備份以來的歸檔日誌,恢復還是比較簡單的,可以作到儘量少的Down機時間,並能作到資料庫的完全恢復。

1 連線資料庫,建立測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 備份資料庫

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

 

3 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

    --------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 關閉資料庫,模擬丟失資料檔案

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:\>del D:\Oracle\ORADATA\TEST\USERS01.DBF

模擬媒體毀壞。

 

5 啟動資料庫錯誤,離線該資料檔案:

SQL> startup

Oracle instance started.

 

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USERS01.DBF'

還可以檢視報警檔案(見上一個恢復案例)或動態檢視v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                    CHANGE#     TIME

---------- ------- ------------------ ---------- -----------

         3   ONLINE                        1013500    2003-05-07

 

離線資料檔案

SQL> alter database datafile 3 offline drop;

Database altered.

 

6 開啟資料庫,複製備份回來(restore),恢復(recover)該資料檔案,並聯機:

SQL> alter database open;

Database altered.


複製備份從備份處

copy d:\databak\ users01.dbf d:\Oracle\oradata\test;


恢復該資料檔案

SQL> recover datafile 3;

ORA-00279: change 1053698 generated at 05/07/2003 17:51:26 needed for

thread 1

ORA-00289: suggestion : 
D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00304.ARC

ORA-00280: change 1053698 for thread 1 is in sequence #304

 

Specify log: {=suggested | filename | AUTO | CANCEL}

AUTO

ORA-00279: change 1053701 generated at 05/07/2003 17:51:39 needed for

thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00305.ARC

ORA-00280: change 1053701 for thread 1 is in sequence #305

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00304.ARC' no longer needed for this recovery Log applied.

Media recovery complete.

恢復成功,聯機該資料檔案

SQL> alter database datafile 3 online;

Database altered.

 

7 檢查資料庫的資料(完全恢復)

SQL> select * from test;

                         A

--------------------------------

                         1

                         2

說明:

1、採用熱備份,需要執行在歸檔模式下,可以實現資料庫的完全恢復,也就是說,從備份後到資料庫崩潰時的資料都不會丟失;

2、可以採用全備份資料庫的方式備份,對於特殊情況,也可以只備份特定的資料檔案,如只備份使用者表空間(一般情況下對於某些寫特別頻繁的資料檔案,可以單獨加大備份頻率);

3、如果在恢復過程中,發現損壞的是多個資料檔案,即可以採用一個一個資料檔案的恢復方法(第5步中需要對資料檔案一一離線,第6步中需要對資料檔案分別恢復),也可以採用整個資料庫的恢復方法;

4、如果是系統表空間的損壞,不能採用此方法。

 

4.2.2 RMAN備份方案

RMAN也可以進行聯機備份,而且備份與恢復方法將比OS備份更簡單可靠。

1、連線資料庫,建立測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int) tablespace users;

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 備份資料庫表空間users

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup tag 'tsuser' format 'd:\backup\tsuser_%u_%s_%p'

4> tablespace users;

5> release channel c1;

6> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=16 devtype=DISK

 

RMAN-03022: compiling command: backup

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=5 set_stamp=494177612 creation_time=16-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00003 name=D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:\BACKUP\TSUSER_05EN93AC_5_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:00:01

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

3 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL>r

1* alter system switch logfile;

System altered.

 

4 關閉資料庫,模擬丟失資料檔案

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:\>del D:\Oracle\ORADATA\TEST\USER01.DBF

 

5 啟動資料庫,檢查錯誤

SQL> startup

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 3 - see DBWR trace file

ORA-01110: data file 3: 'D:\Oracle\ORADATA\TEST\USER01.DBF'

 

6 先開啟資料庫

SQL> alter database datafile 3 offline drop;

Database altered.

SQL> alter database open;

Database altered.

 

7 恢復該表空間

恢復指令碼可以是恢復單個資料檔案

run{

allocate channel c1 type disk;

restore datafile 3;

recover datafile 3;

sql 'alter database datafile 3 online';

release channel c1;

}

也可以是,恢復表空間

run{

allocate channel c1 type disk;

restore tablespace users;

recover tablespace users;

sql 'alter database datafile 3 online';

release channel c1;

}

過程如下:

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

 

RMAN> run{

2> allocate channel c1 type disk;

3> restore datafile 3;

4> recover datafile 3;

5> sql 'alter database datafile 3 online';

6> release channel c1;

7> }

 

//輸出內容冗長,省略--編者

RMAN>

 

8 檢查資料是否完整

SQL> alter database open;

Database altered.

 

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

說明:

1RMAN也可以實現單個表空間或資料檔案的恢復,恢復過程可以在mount下或open方式下,如果在open方式下恢復,可以減少down機時間;

2、如果損壞的是一個資料檔案,建議offline並在open方式下恢復;

3、這裡可以看到,RMAN進行資料檔案與表空間恢復的時候,程式碼都比較簡單,而且能保證備份與恢復的可靠性,所以建議採用RMAN的備份與恢復.

 

4.3丟失多個資料檔案,實現整個資料庫的恢復.

 

4.3.1 OS備份方案

OS備份歸檔模式下損壞(丟失)多個資料檔案,進行整個資料庫的恢復

1 連線資料庫,建立測試表並插入記錄

SQL> connect internal/password as sysdba;

Connected.

 

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 備份資料庫,備份除臨時資料檔案後的所資料檔案

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

 

3 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 關閉資料庫,模擬丟失資料檔案

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

 

C:\>del D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

C:\>del D:\Oracle\ORADATA\TEST\INDX01.DBF

C:\>del D:\Oracle\ORADATA\TEST\TOOLS01.DBF

C:\>del D:\Oracle\ORADATA\TEST\RBS01.DBF

模擬媒體毀壞(這裡刪除多個資料檔案)

 

5 啟動資料庫,檢查錯誤

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

 

詳細資訊可以檢視報警檔案

ORA-1157 signalled during: ALTER DATABASE OPEN...

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 2 - see DBWR trace file

ORA-01110: data file 2: 'D:\Oracle\ORADATA\TEST\RBS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 5 - see DBWR trace file

ORA-01110: data file 5: 'D:\Oracle\ORADATA\TEST\TOOLS01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

Thu May 08 09:39:36 2003

Errors in file D:\Oracle\admin\test\bdump\testDBW0.TRC:

ORA-01157: cannot identify/lock data file 6 - see DBWR trace file

ORA-01110: data file 6: 'D:\Oracle\ORADATA\TEST\INDX01.DBF'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

透過查詢v$recover_file可以看到

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

有四個資料檔案需要恢復

 

6 複製備份回到原地點(restore),開始恢復資料庫(recover)

restore過程:

C:\>copy D:\DATABAK\SYSTEM01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\INDX01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\TOOLS01.DBF D:\Oracle\ORADATA\TEST\

C:\>copy D:\DATABAK\TEST\RBS01.DBF.DBF D:\Oracle\ORADATA\TEST\

 

Recover過程:

SQL> recover database;

 

ORA-00279: change 1073849 generated at 05/08/2003 08:58:35 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00311.ARC

ORA-00280: change 1073849 for thread 1 is in sequence #311

 

Specify log: {=suggested | filename | AUTO | CANCEL}

auto

ORA-00279: change 1073856 generated at 05/08/2003 09:03:27 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00312.ARC

ORA-00280: change 1073856 for thread 1 is in sequence #312

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00311.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073858 generated at 05/08/2003 09:11:43 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00313.ARC

ORA-00280: change 1073858 for thread 1 is in sequence #313

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00312.ARC' no

longer needed for this recovery

 

ORA-00279: change 1073870 generated at 05/08/2003 09:11:46 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00314.ARC

ORA-00280: change 1073870 for thread 1 is in sequence #314

ORA-00278: log file 'D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00313.ARC' no

longer needed for this recovery

 

Log applied.

Media recovery complete.

 

7 開啟資料庫,檢查資料庫的資料(完全恢復)

SQL> alter database open;

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、只要有備份與歸檔存在,就可以實現資料庫的完全恢復(不丟失資料);

2、適合於丟失大量資料檔案,或包含系統資料檔案在內的資料庫的恢復;

3、恢復過程在mount下進行,如果恢復成功,再開啟資料庫,down機時間可能比較長一些。

 

4.3.2 RMAN備份方案

RMAN備份歸檔模式下損壞(丟失)多個資料檔案,進行整個資料庫的恢復

1、連線資料庫,建立測試表並插入記錄

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2、備份資料庫

DOS C:>\ rman cmdfile=bakup.rcv msglog=backup.log;

 

以下是backup.log內容。

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> #     script.:bakup.rcv

2> #     creater:chenjiping

3> #     date:5.8.2003

4> #     desc:backup all database datafile in archive with rman

5>

6> #connect database

7> connect rcvcat rman/rman@back;

8> connect target internal/virpure;

9>

10> #start backup database

11> run{

12> allocate channel c1 type disk;

13> backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

14> include current controlfile;

15> sql 'alter system archive log current';

16> release channel c1;

17> }

18> #end

19>

 

RMAN-06008: connected to recovery catalog database

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=15 devtype=DISK

RMAN-03022: compiling command: backup

RMAN-03023: executing command: backup

RMAN-08008: channel c1: starting full datafile backupset

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08010: channel c1: specifying datafile(s) in backupset

RMAN-08522: input datafile fno=00002 name=D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08522: input datafile fno=00001 name=D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08011: including current controlfile in backupset

RMAN-08522: input datafile fno=00005 name=D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08522: input datafile fno=00004 name=D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08522: input datafile fno=00006 name=D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08522: input datafile fno=00003 name=D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08013: channel c1: piece 1 created

RMAN-08503: piece handle=D:\BACKUP\FULL04EN5UG0_4_1 comment=NONE

RMAN-08525: backup set complete, elapsed time: 00:01:16

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter system archive log current

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

Recovery Manager complete.

到這裡表示備份成功。

 

3 繼續在測試表中插入記錄

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL>alter system switch logfile;

System altered.

SQL> alter system switch logfile;

System altered.

 

4 關閉資料庫,模擬丟失資料檔案

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down

C:\>del D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

C:\>del D:\Oracle\ORADATA\TEST\INDX01.DBF

C:\>del D:\Oracle\ORADATA\TEST\TOOLS01.DBF

C:\>del D:\Oracle\ORADATA\TEST\RBS01.DBF

 

5、啟動資料庫,檢查錯誤

SQL> STARTUP

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

ORA-01157: cannot identify/lock data file 1 - see DBWR trace file

ORA-01110: data file 1: 'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF'

 

查詢v$recover_file

SQL> select * from v$recover_file;

 

     FILE# ONLINE  ERROR                 CHANGE# TIME

---------- ------- ------------------ ---------- -----------

         1 ONLINE  FILE NOT FOUND              0

         2 ONLINE  FILE NOT FOUND              0

         5 ONLINE  FILE NOT FOUND              0

         6 ONLINE  FILE NOT FOUND              0

可以知道有四個資料檔案需要恢復.

 

6、利用RMAN進行恢復

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=1788174720)

RMAN> run{

2> allocate channel c1 type disk;

3> restore database;

4> recover database;

5> sql 'alter database open';

6> release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=17 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03025: performing implicit partial resync of recovery catalog

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=4 set_stamp=494074368 creation_time=15-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:\Oracle\ORADATA\TEST\USER01.DBF

RMAN-08523: restoring datafile 00004 to D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:\BACKUP\FULL04EN5UG0_4_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 327 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00327.ARC

RMAN-06050: archivelog thread 1 sequence 328 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00328.ARC

RMAN-06050: archivelog thread 1 sequence 329 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00329.ARC

RMAN-06050: archivelog thread 1 sequence 330 is already on disk as file D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00330.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00327.ARC thread=1 sequence=327

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00328.ARC thread=1 sequence=328

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: alter database open

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

RMAN>

 

7 檢查資料庫的資料(完全恢復)

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、只要有備份與歸檔存在,RMAN也可以實現資料庫的完全恢復(不丟失資料);

2、同OS備份資料庫恢復,適合於丟失大量資料檔案,或包含系統資料檔案在內的資料庫的恢復;

3、目標資料庫在mount下進行,如果恢復成功,再開啟資料庫;

4RMAN的備份與恢復命令相對比較簡單並可靠,建議有條件的話,都採用RMAN進行資料庫的備份。

 

4.4 不完全恢復案例

 

4.4.1 OS備份下的基於時間的恢復

 

不完全恢復可以分為基於時間的恢復,基於改變的恢復與基於撤消的恢復,這裡已基於時間的恢復為例子來說明不完全恢復過程。

 

基於時間的恢復可以不完全恢復到現在時間之前的某一個時間,對於某些誤操作,如刪除了一個資料表,可以在備用恢復環境上恢復到表的刪除時間之前,然後把該表匯出到正式環境,避免一個人為的錯誤。

 

1 連線資料庫,建立測試表並插入記錄:

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 備份資料庫,這裡最好備份所有的資料檔案,包括臨時資料檔案:

SQL> @hotbak.sql 或在DOS svrmgrl @hotbak.sql

或冷備份也可以

 

3 刪除測試表,假定刪除前的時間為T1,在刪除之前,便於測試,繼續插入資料並應用到歸 

檔。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;

TO_CHAR(SYSDATE,'YY

-------------------

2003-05-21 14:43:01

SQL> drop table test;

Table dropped.

 

4 準備恢復到時間點T1,找回刪除的表,先關閉資料庫:

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

 

5 複製剛才備份的所有資料檔案回來

C:\>copy D:\DATABAK\*.DBF D:\Oracle\ORADATA\TEST\

 

6 啟動到mount

SQL> startup mount;

Oracle instance started.

Total System Global Area  102020364 bytes

Fixed Size                    70924 bytes

Variable Size              85487616 bytes

Database Buffers           16384000 bytes

Redo Buffers                  77824 bytes

Database mounted.

 

7 開始不完全恢復資料庫到T1時間

SQL> recover database until time '2003-05-21:14:43:01';

ORA-00279: change 30944 generated at 05/21/2003 14:40:06 needed for thread 1

ORA-00289: suggestion : D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00191.ARC

ORA-00280: change 30944 for thread 1 is in sequence #191

 

Specify log: {=suggested | filename | AUTO | CANCEL}

auto

Log applied.

Media recovery complete.

8 開啟資料庫,檢查資料

SQL> alter database open resetlogs;

 

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

 

說明:

1、不完全恢復最好備份所有的資料,冷備份亦可,因為恢復過程是從備份點往後恢復的,如果因為其中一個資料檔案的時間戳(SCN)大於要恢復的時間點,那麼恢復都是不可能成功的;

2、不完全恢復有三種方式,過程都一樣,僅僅是recover命令有所不一樣,這裡用基於時間的恢復作為示例;

3、不完全恢復之後,都必須用resetlogs的方式開啟資料庫,建議馬上再做一次全備份,因為resetlogs之後再用以前的備份恢復是很難了;

4、以上是在刪除之前獲得時間,但是實際應用中,很難知道刪除之前的實際時間,但可以採用大致時間即可,或可以採用分析日誌檔案(logmnr),取得精確的需要恢復的時間;

5、一般都是在測試機後備用機器上採用這種不完全恢復,恢復之後匯出/匯入被誤刪的表回生產系統.

 

4.4.2 RMAN備份下的基於改變的恢復

以上用OS備份說明了一個基於時間的恢復,現在用RMAN說明一個基於改變的恢復

 

1 連線資料庫,建立測試表並插入記錄

 

SQL> connect internal/password as sysdba;

Connected.

SQL> create table test(a int);

Table created

SQL> insert into test values(1);

1 row inserted

SQL> commit;

Commit complete

 

2 備份資料庫

C:\>rman

Recovery Manager: Release 8.1.6.0.0 - Production

RMAN> connect rcvcat rman/rman@back

RMAN-06008: connected to recovery catalog database

RMAN> connect target internal/virpure

RMAN-06005: connected to target database: TEST (DBID=874705288)

 

RMAN> run{

2> allocate channel c1 type disk;

3> backup full tag 'dbfull' format 'd:\backup\full%u_%s_%p' database

4> include current controlfile;

5> sql 'alter system archive log current';

6> release channel c1;

7> }

 

    //螢幕輸出內容冗長,省略--編輯

RMAN>

 

3 刪除測試表,在刪除之前,便於測試,繼續插入資料並應用到歸檔,並獲取刪除前的scn號。

SQL> insert into test values(2);

1 row inserted

SQL> commit;

Commit complete

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

SQL> alter system switch logfile;

Statement processed.

SQL> alter system switch logfile;

Statement processed.

 

SQL> select max(ktuxescnw * power(2, 32) + ktuxescnb) scn from x$ktuxe;

      SCN

----------

  31014

SQL> drop table test;

Table dropped.

 

4 準備恢復到SCN 31014,先關閉資料庫,然後啟動到mount

SQL> shutdown immediate;

Database closed.

Database dismounted.

Oracle instance shut down.

SQL> startup mount;

 

5 開始恢復到改變點SCN 31014

RMAN> run{

2>      allocate channel c1 type disk;

3>      restore database;

4>      recover database until scn 31014;

5>      sql 'ALTER DATABASE OPEN RESETLOGS';

6>      release channel c1;

7> }

 

RMAN-03022: compiling command: allocate

RMAN-03023: executing command: allocate

RMAN-08030: allocated channel: c1

RMAN-08500: channel c1: sid=10 devtype=DISK

RMAN-03022: compiling command: restore

RMAN-03022: compiling command: IRESTORE

RMAN-03023: executing command: IRESTORE

RMAN-08016: channel c1: starting datafile backupset restore

RMAN-08502: set_count=1 set_stamp=494613682 creation_time=21-MAY-03

RMAN-08089: channel c1: specifying datafile(s) to restore from backup set

RMAN-08523: restoring datafile 00001 to D:\Oracle\ORADATA\TEST\SYSTEM01.DBF

RMAN-08523: restoring datafile 00002 to D:\Oracle\ORADATA\TEST\RBS01.DBF

RMAN-08523: restoring datafile 00003 to D:\Oracle\ORADATA\TEST\USERS01.DBF

RMAN-08523: restoring datafile 00004 to D:\Oracle\ORADATA\TEST\TEMP01.DBF

RMAN-08523: restoring datafile 00005 to D:\Oracle\ORADATA\TEST\TOOLS01.DBF

RMAN-08523: restoring datafile 00006 to D:\Oracle\ORADATA\TEST\INDX01.DBF

RMAN-08023: channel c1: restored backup piece 1

RMAN-08511: piece handle=D:\BACKUP\FULL01ENMD5I_1_1 tag=DBFULL params=NULL

RMAN-08024: channel c1: restore complete

RMAN-03023: executing command: partial resync

RMAN-08003: starting partial resync of recovery catalog

RMAN-08005: partial resync complete

RMAN-03022: compiling command: recover

RMAN-03022: compiling command: recover(1)

RMAN-03022: compiling command: recover(2)

RMAN-03022: compiling command: recover(3)

RMAN-03023: executing command: recover(3)

RMAN-08054: starting media recovery

RMAN-03022: compiling command: recover(4)

RMAN-06050: archivelog thread 1 sequence 191 is already on disk as file D:\ORACL

E\ORADATA\TEST\ARCHIVE\TESTT001S00191.ARC

RMAN-06050: archivelog thread 1 sequence 192 is already on disk as file D:\ORACL

E\ORADATA\TEST\ARCHIVE\TESTT001S00192.ARC

RMAN-03023: executing command: recover(4)

RMAN-08515: archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00191.AR

C thread=1 sequence=191

RMAN-08515:archivelog filename=D:\Oracle\ORADATA\TEST\ARCHIVE\TESTT001S00192.ARC

Thread=1 sequence=192

RMAN-08055: media recovery complete

RMAN-03022: compiling command: sql

RMAN-06162: sql statement: ALTER DATABASE OPEN RESETLOGS

RMAN-03023: executing command: sql

RMAN-03022: compiling command: release

RMAN-03023: executing command: release

RMAN-08031: released channel: c1

 

6 檢查資料

Database altered.

SQL> select * from test;

                         A

---------------------------------------

                         1

                         2

可以看到,表依然存在。

 

說明:

1 RMAN也可以實現不完全恢復,方法比OS備份恢復的方法更簡單可靠;

2 RMAN可以基於時間,基於改變與基於日誌序列的不完全恢復,基於日誌序列的恢復可以指定恢復到哪個日誌序列,如

run { 

        allocate channel ch1 type disk; 

        allocate channel ch2 type 'sbt_tape';

        set until logseq 1234 thread 1;

        restore controlfile to '$Oracle_HOME/dbs/cf1.f' ; 

        replicate controlfile from '$Oracle_HOME/dbs/cf1.f';

        alter database mount; 

        restore database; 

        recover database; 

        sql "ALTER DATABASE OPEN RESETLOGS";

}

3 與所有的不完全恢復一樣,必須在mount下,restore所有備份資料檔案,需要resetlogs

4 基於改變的恢復比基於時間的恢復更可靠,但是可能也更復雜,需要知道需要恢復到哪一個改變號(SCN),在正常生產中,獲取SCN的辦法其實也有很多,如查詢資料庫字典表(V$archived_log or v$log_history),或分析歸檔與聯機日誌(logmnr)等。

第五章 其它恢復案例

5.1 損壞聯機日誌的恢復方法

5.1.1 損壞非當前聯機日誌

大家都清楚,聯機日誌分為當前聯機日誌和非當前聯機日誌,非當前聯機日誌的損壞是比較簡單的,一般透過clear命令就可以解決問題。


1
、啟動資料庫,遇到ORA-00312 or ORA-00313錯誤,如

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

從這裡我們知道日誌組1的資料檔案損壞了

從報警檔案可以看到更詳細的資訊

2 檢視V$log檢視

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1     YES      INACTIVE

         2          2     YES      INACTIVE

         3          3     NO       CURRENT

可以知道,該組是非當前狀態,而且已經歸檔。

3 CLEAR命令重建該日誌檔案

SQL>alter database clear logfile group 1;

如果是該日誌組還沒有歸檔,則需要用

SQL>alter database clear unarchived logfile group 1;

4 開啟資料庫,重新備份資料庫

SQL>alter database open;

 

說明:

1、如果損壞的是非當前的聯機日誌檔案,一般只需要clear就可以重建該日誌檔案,但是如果該資料庫處於歸檔狀態但該日誌還沒有歸檔,就需要強行clear

2、建議clear,特別是強行clear後作一次資料庫的全備份;

3、此方法適用於歸檔與非歸檔資料庫。

 

5.1.2 損壞當前聯機日誌

 

歸檔模式下當前日誌的損壞有兩種情況,

一、是資料庫是正常關閉,日誌檔案中沒有未決的事務需要例項恢復,當前日誌組的損 壞就可以直接用alter database clear unarchived logfile group n來重建。

二、是日誌組中有活動的事務,資料庫需要媒體恢復,日誌組需要用來同步,有兩種補救辦法:

A.  最好的辦法就是透過不完全恢復,可以保證資料庫的一致性,但是這種辦法要求在歸檔方式下,並且有可用的備份

B.  透過強制性恢復,但是可能導致資料庫不一致。


下面分別用來說明這兩種恢復方法:

 

5.1.2.1 透過備份來恢復

1 開啟資料庫,會遇到一個類似的錯誤

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案

 

2 檢視V$log,發現是當前日誌

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#      SEQUENCE# ARCHIVED STATUS

--------- ---------- -------- ----------------

         1          1     NO       CURRENT

         2          2     YES      INACTIVE

         3          3     YES      INACTIVE

 

3 發現clear不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

 

4 複製有效的資料庫的全備份,並不完全恢復資料庫:

可以採用獲取最近的SCN的辦法用until scn恢復或用until cnacel恢復

recover database until cancel

先選擇auto,儘量恢復可以利用的歸檔日誌,然後重新

recover database until cancel

這次輸入cancel,完成不完全恢復,也就是說恢復兩次。

如:

SQL> recover database until cancel;

Auto

……

SQL> recover database until cancel;

Cancel;

5 利用alter database open resetlogs開啟資料庫.

 

說明:

  1、這種辦法恢復的資料庫是一致的不完全恢復,會丟失當前聯機日誌中的事務資料;

  2、這種方法適合於歸檔資料庫並且有可用的資料庫全備份;

  3、恢復成功之後,記得再做一次資料庫的全備份;

  4、建議聯機日誌檔案一定要實現鏡相在不同的磁碟上,避免這種情況的發生,因為任何資料的丟失對於生產來說都是不容許的。

 

5.1.2.2 如果沒有備份,進行強制性恢復

1 開啟資料庫,會遇到一個類似的錯誤

ORA-00313: open failed for members of log group 1 of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案

 

2 檢視V$log,發現是當前日誌

SQL> select group#,sequence#,archived,status from v$log;

 

    GROUP#  SEQUENCE# ARCHIVED STATUS

---------- ---------- -------- ----------------

         1          1 NO       CURRENT

         2          2 YES      INACTIVE

         3          3 YES      INACTIVE

 

3 發現clear不成功

SQL> alter database clear unarchived logfile group 1;

alter database clear unarchived logfile group 1

*

ERROR at line 1:

ORA-01624: log 1 needed for crash recovery of thread 1

ORA-00312: online log 1 thread 1: 'D:\Oracle\ORADATA\TEST\REDO01.LOG'

 

4 把資料庫down

    SQL>shutdown immediate

 

5 init.ora中加入如下引數

     _allow_resetlogs_corruption=TRUE

 

6 重新啟動資料庫,利用until cancel恢復

    SQL>recover database until cancel;

    Cancel

如果出錯,不再理會,發出

SQL>alter database open resetlogs;

 

7 資料庫被開啟後,馬上執行一個full export

 

8 shutdown資料庫,去掉_all_resetlogs_corrupt引數

 

9 重建庫

 

10import並完成恢復

 

11、建議執行一下ANALYZE TABLE ...VALIDATE STRUCTURE CASCADE;

說明:

1、該恢復方法是沒有辦法之後的恢復方法,一般情況下建議不要採用,因為該方法可能導致資料庫的不一致;

2、該方法也丟失資料,但是丟失的資料沒有上一種方法的資料多,主要是未寫入資料檔案的已提交或未提交資料;

3、建議成功後嚴格執行以上的711步,完成資料庫的檢查與分析;

4、全部完成後做一次資料庫的全備份;

5、建議聯機日誌檔案一定要實現鏡相在不同的磁碟上,避免這種情況的發生,因為任何資料的丟失對於生產來說都是不容許的。

5.2 損壞控制檔案的恢復方法

 

5.2.1 損壞單個控制檔案

損壞單個控制檔案是比較容易恢復的,因為一般的資料庫系統,控制檔案都不是一個,而且所有的控制檔案都互為鏡相,只要複製一個好的控制檔案替換壞的控制檔案就可以了。

 

1 控制檔案損壞,最典型的就是啟動資料庫出錯,不能mount資料庫

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

檢視報警日誌檔案,有如下資訊

alter database  mount

Mon May 26 11:59:52 2003

ORA-00202: controlfile: 'D:\Oracle\oradata\chen\control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

2 停止資料庫:

SQL>shutdown immediate

 

3 複製一個好的控制檔案替換壞的控制檔案或修改init.ora中的控制檔案引數,取消這個壞的控制檔案。

 

4 重新啟動資料:

SQL>startup

 

說明:

1、損失單個控制檔案是比較簡單的,因為資料庫中所有的控制檔案都是鏡相的,只需要簡單的

複製一個好的就可以了;

2、建議鏡相控制檔案在不同的磁碟上;

3、建議多做控制檔案的備份,長期保留一份由alter database backup control file to trace產生的控制檔案的文字備份。


5.2.2 
損壞全部控制檔案

 

損壞多個控制檔案,或者人為的刪除了所有的控制檔案,透過控制檔案的複製已經不能解決問題,這個時候需要重新建立控制檔案。

 

同時注意,alter database backup control file to trace可以產生一個控制檔案的文字備份。


以下是詳細重新建立控制檔案的步驟:

1 關閉資料庫

SQL>shutdown immediate;

2 刪除所有控制檔案,模擬控制檔案的丟失

 

3 啟動資料庫,出現錯誤,並不能啟動到mount

SQL>startup

ORA-00205: error in identifying controlfile, check alert log for more info

檢視報警日誌檔案,有如下資訊

alter database  mount

Mon May 26 11:53:15 2003

ORA-00202: controlfile: 'D:\Oracle\oradata\chen\control01.ctl'

ORA-27041: unable to open file

OSD-04002: unable to open file

O/S-Error: (OS 2) 系統找不到指定的檔案。

 

4 關閉資料庫

SQL>shutdown immediate;

 

5 internalsys下執行如下建立控制檔案的指令碼,注意完整列出聯機日誌或資料檔案的路徑,或修改由alter database backup control file to trace備份控制檔案時產生的指令碼,去掉多餘的註釋即可。

STARTUP NOMOUNT

CREATE CONTROLFILE REUSE DATABASE "TEST" NORESETLOGS NOARCHIVELOG

         MAXLOGFILES 32

         MAXLOGMEMBERS 2

         MAXDATAFILES 254

         MAXINSTANCES 1

         MAXLOGHISTORY 226

LOGFILE

    GROUP 1 'D:\Oracle\ORADATA\TEST\REDO01.LOG'  SIZE 1M,

    GROUP 2 'D:\Oracle\ORADATA\TEST\REDO02.LOG'  SIZE 1M,

    GROUP 3 'D:\Oracle\ORADATA\TEST\REDO03.LOG'  SIZE 1M

DATAFILE

    'D:\Oracle\ORADATA\TEST\SYSTEM01.DBF',

    'D:\Oracle\ORADATA\TEST\RBS01.DBF',

    'D:\Oracle\ORADATA\TEST\USERS01.DBF',

    'D:\Oracle\ORADATA\TEST\TEMP01.DBF',

    'D:\Oracle\ORADATA\TEST\TOOLS01.DBF',

    'D:\Oracle\ORADATA\TEST\INDX01.DBF'

CHARACTER SET ZHS16GBK;

 

-- Recovery is required if any of the datafiles are restored backups,

-- or if the last shutdown was not normal or immediate.

RECOVER DATABASE

--if the last shutdown was not normal or immediate

--noarchive

-- RECOVER DATABASE UNTIL CANCELUSING BACKUP CONTROLFILE

--archive

-- RECOVER DATABASE USING BACKUP CONTROLFILE UNTIL CANCEL

-- Database can now be opened normally.

ALTER DATABASE OPEN;

--if recover database until cancel

--ALTER DATABASE OPEN RESETLOGS;

6 如果沒有錯誤,資料庫將啟動到open狀態下。

 

說明:

1、重建控制檔案用於恢復全部資料檔案的損壞,需要注意其書寫的正確性,保證包含了所有的資料檔案與聯機日誌;

2、經常有這樣一種情況,因為一個磁碟損壞,我們不能再恢復(store)資料檔案到這個磁碟,因此在store到另外一個盤的時候,我們就必須重新建立控制檔案,用於識別這個新的資料檔案,這裡也可以用這種方法用於恢復。

 

5.3 損壞回滾資料檔案的恢復方法

回滾段表空間中的一個資料檔案丟失或者損壞導致資料庫無法識別它,在啟動資料庫的時候會出現ORA-1157, ORA-1110的錯誤,或者作業系統級別的錯誤,例如ORA-7360。在關閉資料庫的時候(normal或者immediate)會出現ORA-1116, ORA-1110的錯誤,或者作業系統級別的錯誤,例如ORA-7368

 

感謝Coolyl的辛勤工作,關於回滾段的大部分內容都是摘自他在itpub的文章。

 

5.3.1 損壞資料檔案,但資料庫處於Open狀態

如果你發現有回滾段的資料檔案丟失或者損壞了,而此時的資料庫是處於開啟的狀態下並且在執行,就千萬不要關閉資料庫了,因為在大多數的情況下開啟的時候比關閉的時候好解決問題一些。

 

一般也是存在有兩種情況:

A、是offline丟失或損壞的資料檔案,然後從一個備份中恢復,執行介質恢復以保持一致性。但是這種情況要求資料庫是歸檔方式下才可以採用的。

B、是offline那個存在丟失或損壞的資料檔案所在的整個回滾段表空間,然後刪除整個回滾段表空間並重建,但是你必須要殺掉那些在回滾段中已經啟用的使用者程式才可以offline的。

通常第一種情況就比較簡單實現,但是更多的使用者事務將會出錯並且回滾。

 

A的具體步驟:

1 offline丟失或損壞的資料檔案

ALTER DATABASE DATAFILE '' OFFLINE;

2 從一個有效的備份中恢復。

3 執行以下查詢:

SELECT V1.GROUP#, MEMBER, SEQUENCE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

這個將列出你的所有redolog檔案以及它們所代表的sequence numbers

4 恢復資料檔案。

RECOVER DATAFILE ''

5 確信你應用了所有的redolog檔案,直至出現提示資訊"Media recovery complete"

6 online那個資料檔案。

ALTER DATABASE DATAFILE '' ONLINE;

 

B的具體步驟:

1 offline存在丟失或損壞的資料檔案的回滾段表空間中的所有回滾段。

ALTER ROLLBACK SEGMENT OFFLINE;

2 檢測當然回滾段的狀態。

SELECT SEGMENT_NAME, STATUS FROM DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '';

3 刪除所有offline的回滾段

DROP ROLLBACK SEGMENT ;

4 處理那些online狀態的回滾段。

重新執行第二步的查詢

如果你已經執行過offline操作的回滾段狀態仍然是online,則說明這個回滾段內有活動的事務。你要接著查詢

SELECT SEGMENT_NAME, XACTS ACTIVE_TX, V.STATUS

FROM V$ROLLSTAT V, DBA_ROLLBACK_SEGS

WHERE TABLESPACE_NAME = '' AND SEGMENT_ID = USN;

如果沒有返回結果,則證明存在丟失或損壞的資料檔案的回滾段表空間中的所有回滾段都已經被offline了,然後重新執行第二步,第三步。如果查詢有結果返回,則狀態應該是"PENDING OFFLINE".接著檢視ACTIVE_TX列,如果值為0,則表明此回滾段中已經沒有未處理的事務了,很快就會被offline的,然後等它offline後重新執行23步後跳至第六步。如果值大於0,則繼續到第五步。

5 強制那些包含活動事務的回滾段offline

活動的事務應該被提交或者回滾,執行下面的查詢看看哪些使用者佔用了回滾段:

SELECT S.SID, S.SERIAL#, S.USERNAME, R.NAME "ROLLBACK"

FROM V$SESSION S, V$TRANSACTION T, V$ROLLNAME R

WHERE R.NAME IN ('', ... ,

'')

AND S.TADDR = T.ADDR AND T.XIDUSN = R.USN;

最好能直接聯絡到那些user讓他們自己去回滾或者提交事務,如果不能做到的話,那就只能強制性的殺掉程式了。

ALTER SYSTEM KILL SESSION ', ';

殺掉程式後再過一段時間後回滾段會自動清除那些事務,然後就可以回到第二步繼續查詢了。

6 刪除回滾段。

DROP TABLESPACE INCLUDING CONTENTS;

7 重建回滾段並online它們。

 

說明:

1、資料庫如果是open狀態,就可以直接在open狀態下解決問題,沒有必要停下資料庫,增加down機時間;

2、不管上上面那種恢復方法都是正常性的恢復,不會引起資料的不一致或錯誤。

 

5.3.2資料庫關閉,但是資料檔案中沒有活動事務

 

這種情況下最簡單的方法就是offline drop掉這個壞了的或者丟失的資料檔案,然後以restricted模式開啟資料庫然後刪除並且重建包含損壞檔案的回滾段表空間。

 

具體步驟如下:

1 確定資料庫是正常的關閉的。方法是可以去檢視alert檔案,到最後看是否有如下資訊:

"alter database dismount

Completed: alter database dismount"

如果有的話,就證明資料庫是正常關閉的,否則就不能用這個方法去恢復。

2 修改init引數檔案,移去ROLLBACK_SEGMENTS中包含的損壞資料檔案的回滾段表空間的回滾段,如果你不能確定哪些回滾段是壞的,簡單的方法是你可以註釋掉整個ROLLBACK_SEGMENTS

3 restricted模式去mount資料庫。

STARTUP RESTRICT MOUNT

4 offline drop掉那個壞的資料檔案

ALTER DATABASE DATAFILE '' OFFLINE DROP;

5 開啟資料庫

ALTER DATABASE OPEN

如果你看到如下資訊"Statement processed",則跳到第7步,如果你看到ORA-604, ORA-376, and ORA-1110的錯誤資訊,繼續第6步。

6、    正常的關閉資料庫,然後在init檔案中註釋掉ROLLBACK_SEGMENTS,並加入隱含引數

_corrupted_rollback_segments = ( ,...., )

然後以restricted模式開啟資料庫

STARTUP RESTRICT

7 刪除掉那個包含損壞檔案的回滾段表空間。

DROP TABLESPACE INCLUDING CONTENTS;

8 重建回滾段表空間,記得建立後要把回滾段都online

9 重新使資料庫對所有使用者可用。

ALTER SYSTEM DISABLE RESTRICTED SESSION;

10、然後正常關閉資料庫,修改init檔案,如果開始只是註釋掉了ROLLBACK_SEGMENTS的,就去掉註釋即可,如果加了隱含引數的,註釋掉它,並在ROLLBACK_SEGMENTS加入所有的回滾段。

11、正常啟動資料庫:

Startup

說明

1、這種方法的前提條件是資料庫是正常關閉(不是abort)可用;

2、這種方法是正常方法,不會引起資料錯誤。

 

5.3.3 資料庫關閉,資料檔案中有活動事務,沒有可用備份。

一般造成這種原因的情況是採用了shutdown abort或其它原因異常關機(如斷電)導致的。

 

1、開啟一個事務

SQL> set transaction use rollback segment rbs0;

Transaction set.

SQL> insert into test (a) values (1);

1 row created.

 

2、異常關閉

SQL> shutdown abort;

Oracle instance shut down.

 

3、刪除rbs的一個資料檔案

C:>del D:\Oracle\oradata\chen\rbs01.

 

4、修改INIT.ora :

rollback_segments=(system)

新增_corrupted_rollback_segments=(rbs0,rbs1,rbs2……)

 

5SQL>Startup mount

 

6SQL>alter database datafile 'd:\Oracle\oradata\t8i\rbs01.dbf' offline drop;

資料庫已更改。

 

7SQL>recover database 

完成介質恢復。

 

8SQL>alter database open ;

資料庫已更改。

 

9SQL>select * from v$rollname;

 

         USN    NAME

----   -------

         0       SYSTEM

 

10SQL>select segment_name,tablespace_name,status 
FROM dba_rollback_segs; 

SEGMENT_NAME TABLESPACE_NAME      STATUS

----------- ------ ------------------------------------

SYSTEM        SYSTEM               ONLINE

RBS0          RBS                  NEEDS RECOVERY

RBS1          RBS                   NEEDS RECOVERY

RBS2          RBS                  NEEDS RECOVERY

 

11SQL>drop rollback segment rbs0;

重算段已丟棄。

    SQL>drop rollback segment rbs1;

重算段已丟棄。

    SQL>drop rollback segment rbs2;

重算段已丟棄。

 

12SQL>select segment_name,tablespace_name,status 
FROM dba_rollback_segs; 

SEGMENT_NAME TABLESPACE_NAME   STATUS

-------------------------------------

SYSTEM        SYSTEM            ONLINE

 

13SQL>drop tablespace rbs including contents;

表空間已丟棄。

 

14、重建新的回滾表空間及回滾段,並聯機。

 

15SQL>shutdown abort

 

16、再修改INIT.ora 

rollback_segments=(rbs0,rbs1,rbs2)

_corrupted_rollback_segments=(rbs0,rbs1,rbs2)去掉。

 

17SQL>startup

 

說明:

1、這種辦法是萬不得以的時候使用的方法,如果有備份,都建議從備份上進行恢復;

2、這種方法恢復的資料庫,可能會引起資料庫的資料錯誤;

3、恢復成功以後,建議exp/imp資料,並重新分析檢查資料庫。


5.3.4 
資料庫關閉,資料檔案中有活動事務,從備份恢復

1、從一個有效的備份中恢復損壞的資料檔案。

2mount資料庫。

3、執行以下查詢:

SELECT FILE#, NAME, STATUS FROM V$DATAFILE;

如果發現要恢復的檔案是offline狀態的話,要先online它:

ALTER DATABASE DATAFILE '' ONLINE;

4、執行以下查詢

SELECT V1.GROUP#, MEMBER, SEQUENCE#, FIRST_CHANGE#

FROM V$LOG V1, V$LOGFILE V2

WHERE V1.GROUP# = V2.GROUP# ;

這個將列出redlog檔案所代表的sequencefirst change numbers

 

5、如果資料庫是非歸檔情況下,執行以下查詢:

SELECT FILE#, CHANGE# FROM V$RECOVER_FILE;

如果CHANGE#大於最小的redolog檔案的FIRST_CHANGE#,則資料檔案可以被恢復,記得在應用日誌的時候要把所有redolog檔案全部應用一遍。 

如果CHANGE#小於最小的redolog檔案的FIRST_CHANGE#,則資料檔案就不可以被恢復了,這時候你要從一個有效的全備份中去恢復資料庫了,如果沒有全備份的話,那你就只能把資料庫強制開啟到一個不一致的狀態去exp出資料,然後重新建庫匯入資料,因為這種方式的恢復Oracle是不推薦使用者自己做的,所以這裡我就不詳細說明了。

 

6、恢復資料檔案:

RECOVER DATAFILE ''

7、確信你應用了所有的redolog檔案,直至出現提示資訊"Media recovery complete"

8、開啟資料庫。

說明:

1、這種方法要求在歸檔有備份的方式下進行,而且是建議方式;

2、這種方法不會導致資料庫的錯誤。

5.4 損壞臨時資料檔案的恢復方法

 

臨時資料檔案的恢復是比較簡單的,因為臨時檔案中不涉及到其它的有用的資料,所以可以刪除後重建。

1、關閉資料庫:

SQL>shutdown immediate

2、刪除臨時資料檔案,模擬媒體失敗;

 

3、啟動資料庫,檢測到檔案錯誤;

 

4、離線該資料檔案:

SQL>alter database datafile '檔名全名' offline drop;

 

5、開啟資料庫

SQL>alter database open

 

6、刪除該臨時表空間

SQL>drop tablespace temp(或其它臨時表空間名稱);

 

7、重新建立該表空間,並重新分配給使用者。

說明:

1、臨時資料檔案是非重要檔案,不儲存永久資料,可以隨時刪除重建,不影響資料庫的資料安全;

2、如果重新建立以後,別忘了重新分配給使用者。

第六章常見恢復誤區

1可以不需要備份,只有歸檔就能進行資料庫的向前的恢復

:這個在Oracle 9i以前起碼是不可能的,在別的資料庫我也沒有聽說過,不完全恢復的主要思路是利用不完全點之前的備份,加上歸檔日誌,恢復到不完全恢復點,9i中出現了一個flashback的特性,這個特性的使用,也是有很多侷限的。

2進行不完全恢復只需要複製一個需要恢復的備份資料檔案

:不完全恢復需要複製所有的資料檔案,最好包括臨時資料檔案在內,否則需要另外的處理,如果有一個資料檔案的SCN大於不完全恢復點,那麼這個恢復都將是失敗的。


3
使用RMAN目錄與目標資料庫在同一資料庫能很好進行資料庫的恢復

:使用恢復目錄與目標資料庫在同一個資料庫中,將存在很大的恢復侷限,如該資料庫的系統資料檔案的損害,資料庫根本不能open,那麼RMAN也就無法連線恢復目錄,也就不存在恢復了。

第七章小結


這裡我們反覆演示了多種情況下的恢復方案,透過這些演示,我們應該掌握瞭如下內容:

1、利用OSRMAN進行各種常規備份與恢復。

2、熟悉沒有備份或簡單的非常規備份與恢復的方法。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/14710393/viewspace-754845/,如需轉載,請註明出處,否則將追究法律責任。

相關文章