如何處理Oracle資料庫中的壞塊問題(轉)

zhouwf0726發表於2019-05-15
本文主要介紹如何去處理在Oracle資料庫中出現壞塊的問題,對於壞塊產生在不同的物件上,處理的方法會有所不同,本文將大致對這些方法做一些介紹。因為資料庫執行時間長了,由於硬體裝置的老化,出現壞塊的機率會越來越大,因此,做為一個DBA,怎麼去解決資料庫出現的壞塊問題就成了一個重要的議題了。


一:什麼是資料庫的壞塊

首先我們來大概看一下資料庫塊的格式和結構

資料庫的資料塊有固定的格式和結構,分三層:cache layertransaction layerdata layer。在我們對資料塊進行讀取寫入操作的時候,資料庫會對要讀寫的資料塊做一致性的檢查,其中包括:資料塊的型別、資料塊的地址資訊、資料塊的SCN號以及資料塊的頭部和尾部。如果發現其中有不一致的資訊,那資料庫就會標記這個資料塊為壞塊了。資料庫的壞塊分為兩種,邏輯壞塊和物理壞塊。

二:壞塊對資料庫產生的影響

如果資料庫出現壞塊,資料庫的告警日誌檔案裡面會存在有如下的一些報錯資訊:Ora-1578以及Ora-600 and trace file in bdump directory,其中Ora-600錯誤的第一個引數值的範圍是[2000]-[8000],不同的值代表著資料塊的不同的層出現問題,具體的如下表所示:

Range block layer

Cache layer 2000 – 4000

Transaction layer 4000 – 6000

Data layer 6000 - 8000

壞塊產生影響的物件可能是資料字典表、回滾段表、臨時段、使用者資料表和索引等。不同的物件產生壞塊後的處理方法不盡相同。

三:壞塊產生的原因

Oracle呼叫標準C的系統函式,對資料塊進行讀寫操作,因此,壞塊是有可能由以下幾種原因產生:

Ø 硬體的I/O錯誤

Ø 作業系統的I/O錯誤或緩衝問題

Ø 記憶體或paging問題

Ø 磁碟修復工具

Ø 一個資料檔案的一部分正在被覆蓋

Ø Oracle試圖訪問一個未被格式化的系統塊失敗

Ø 資料檔案部分溢位

Ø Oracle或者作業系統的bug

四:壞塊的處理方法

1. 先收集相應的關於壞快的資訊,從AlertSID.log檔案或者從trace檔案中查詢,找到例如以下的一些資訊:

Ora-1578 file# (RFN) block#

Ora-1110 file# (AFN) block#

Ora-600 file# (AFN) block#

其中RFN表示的是relative_fno

AFN表示的是file_id

Select file_name,tablespace_name,file_id “AFN”,relative_fno “RFN”

From dba_data_files;

Select file_name,tablespace_name,file_id, relative_fno“RFN”

From dba_temp_files;

2. 確定存在壞塊的物件是什麼:

SELECT tablespace_name, segment_type, owner, segment_name, partition_name FROM dba_extents WHERE file_id = and between block_id AND block_id + blocks – 1

通過上面這個查詢語句就可以查出當前存在壞塊的物件是什麼,是什麼型別的物件。需要注意的是如果是temp檔案中出現壞塊,是沒有記錄返回的。

3. 根據2中查詢出來的物件型別,確定相應的處理方法

出現壞塊的常見物件有:

Ø Sys使用者下的物件

Ø 回滾段

Ø 臨時段

Ø 索引或者分割槽索引

Ø

常用的處理方法有:

Ø 恢復資料檔案

Ø 只恢復壞的block9i以上版本可用)

Ø 通過ROWID RANGE SCAN 儲存資料

Ø 使用DBMS_REPAIR

Ø 使用EVENT

4. 具體處理方法的介紹

Ø 恢復資料檔案方法:

如果資料庫是歸檔方式下,並且有完整的物理備份,就可以使用此方法來恢復。

步驟如下:

1) offline受影響的資料檔案,執行以下的語句:

ALTER DATABASE DATAFILE 'name_file' OFFLINE

2) 保留有壞塊的資料檔案,然後拷貝備份的資料檔案。如果恢復的資料檔案要求路徑不同,執行以下的語句:

ALTER DATABASE RENAME FILE 'old_name' TO 'new_name';

3) 恢復資料檔案,執行以下語句:

RECOVER DATAFILE 'name_of_file';

4) Online恢復後的資料檔案,執行以下的語句:

ALTER DATABASE DATAFILE 'name_of_file' ONLINE;

Ø 只恢復壞的block9i以上版本可用)

使用這種方法要求資料庫版本是9.2.0以上,要求配置了Rmancatalog資料庫,資料庫為歸檔方式,並且有完整的物理備份。

步驟如下:

使用RMANBLOCKRECOVER命令 :

Rman>run{blockrecover datafile 5 block 11,16;}

也可以強制使用某個SCN號之前的備份,恢復資料塊。

Rman>run{blockrecover datafile 5 block 11,16 restore until sequence 8505;}

Ø 通過ROWID RANGE SCAN 儲存資料

1) 先取得壞塊中ROW ID的最小值,執行以下的語句:

SELECT dbms_rowid.rowid_create(1,,,,0) from DUAL;

2)取得壞塊中的ROW ID的最大值,執行以下的語句:

SELECT dbms_rowid.rowid_create(1,,,+1,0) from DUAL;

3)建議一個臨時表儲存那些沒有壞塊的資料,執行以下的語句:

CREATE TABLE salvage_table AS SELECT * FROM corrupt_tab Where 1=2;

4)儲存那些不存在壞塊的資料到臨時表中,執行以下的語句:

INSERT INTO salvage_table SELECT /*+ ROWID(A) */ * FROM A WHERE rowid < ''

INSERT INTO salvage_table SELECT /*+ ROWID(A) */ * FROM A WHERE rowid >= '‘;

5) 根據臨時表中的資料重建表,重建表上的索引,限制。

Ø 使用10231診斷事件,在做全表掃描的時候跳過壞塊

可以在session級別設定:

ALTER SESSION SET EVENTS '10231 TRACE NAME CONTEXT FOREVER, LEVEL 10';

也可以在資料庫級別上設定,在初始化引數中加入:event="10231 trace name context forever, level 10" ,然後重啟資料庫。

然後從存在壞塊的表中取出不存在壞塊的資料,執行以下的語句:

CREATE TABLE salvage_emp AS SELECT * FROM corrupt_table;

最後rename生成的corrupt_table為原來表的名字,並重建表上的索引和限制。

Ø 使用dbms_repair包進行恢復

使用dbms_repair標記有壞塊的表,在做全表掃描的時候跳過壞塊,執行以下的語句:

Execute DBMS_REPAIR.SKIP_CORRUPT_BLOCKS('','');

然後使用exp工具或者createtable as select的方法取出沒有壞塊資料,然後重建表,表上的索引和限制。

五:壞塊的預先發現的方法

1. 如果要檢測資料庫中所有的表,可以利用exp工具匯出整個資料庫可以檢測壞塊。不過這個工具有一些缺陷,對以下情況的壞塊是檢測不出來的:

Ø HWM以上的壞塊是不會發現的

Ø 索引中存在的壞塊是不會發現的

Ø 資料字典中的壞塊是不會發現的

2. 如果只是對資料庫中比較重要的表進行壞塊檢查,可以使用ANALYZE TABLE tablename VALIDATE STRUCTURE CASCADE 的方法來檢測壞塊,它執行壞塊的檢查,但是不會標記壞塊為corrupt,檢測的結果儲存在USER_DUMP_DEST目錄下的使用者trace檔案中。

3. 使用Oracle的專門工具dbv來檢查壞塊,具體的語法如下:

關鍵字 說明 (預設)

----------------------------------------------------

FILE 要驗證的檔案 ()

START 起始塊 (檔案的第一個塊)

END 結束塊 (檔案的最後一個塊)

BLOCKSIZE 邏輯塊大小 (2048)

LOGFILE 輸出日誌 ()

FEEDBACK 顯示進度 (0)

PARFILE 引數檔案 ()

USERID 使用者名稱/口令 ()

SEGMENT_ID ID (tsn.relfile.block) ()

例如:

Dbv file=system01.dbf blocksize=8192

DBVERIFY: Release 9.2.0.5.0 - Production on 星期六 11 27 15:29:13 2004

Copyright (c) 1982, 2002, Oracle Corporation. All rights reserved.

DBVERIFY - 驗證正在開始 : FILE = system01.dbf

DBVERIFY - 驗證完成

檢查的頁總數 32000

處理的頁總數(資料):13261

失敗的頁總數(資料):0

處理的頁總數(索引):2184

失敗的頁總數(索引):0

處理的頁總數(其它):1369

處理的總頁數 () : 0

失敗的總頁數 () : 0

空的頁總數 15186

標記為損壞的總頁數:0

匯入的頁總數 0

注:因為dbv要求file後面跟的必須是一個副檔名,所以如果用裸裝置儲存的,就必須使用ln連結裸裝置到一個檔案,然後再用dbv對這個連結檔案進行檢查。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/756652/viewspace-242370/,如需轉載,請註明出處,否則將追究法律責任。

相關文章