高速的匯出/匯入:Oracle Data Pump
轉自:http://www.comprg.com.cn/detail.asp?hw_id=7156
利用 Oracle Database 10g 實用工具資料移動得到了很大的提高。
迄今為止,匯出/匯入工具集仍是跨多個平臺轉移資料所需勞動強度最小的首選實用工具,儘管人們常常抱怨它速度太慢。匯入只是將每條記錄從匯出轉儲檔案中讀出來,然後使用常見的 INSERT INTO 命令將其插入到目標表中,因此匯入可能是個很慢的過程,這一點並不讓人感到吃驚。
進入 Oracle Data Pump,Oracle Database 10g 中的匯出/匯入工具包的更新更快的同類工具,它被設計來成倍地加速這個過程。
Data Pump 反映了整個匯出/匯入過程的徹底革新。它不是使用常見的 SQL 命令,而是應用專用 API 來以更快得多的速度載入和解除安裝資料。在我的測試中,我看到匯出效能比在直接模式下提高了 10-15 倍,匯入過程效能提高了 5 倍。此外,與使用匯出實用工具不同,它還能夠只取出特定型別的物件(如過程)。
Data Pump 匯出
這個新的實用工具稱為 expdp,以和原來的匯出 exp 區分開。在本例中,我們將用 Data Pump 來匯出一個大表 CASES,大小約為 3GB。Data Pump 在伺服器端使用檔案處理來建立和讀取檔案;因此,目錄作為位置使用。在這種情況下,我們將使用檔案系統 /u02/dpdata1 來儲存轉儲檔案。
create directory dpdata1 as '/u02/dpdata1';
grant read, write on directory dpdata1 to ananda;
接下來,我們將匯出資料:
expdp ananda/abc123 tables=CASES directory=DPDATA1
dumpfile=expCASES.dmp job_name=CASES_EXPORT
讓我們來分析該命令的各個部分。使用者 ID/口令組合、表和轉儲檔案引數的意義是顯而易見的。與原來的匯出不同,檔案是在伺服器(不是客戶端)上建立的。位置由目錄引數值 DPDATA1 指定,它指向之前建立的 /u02/dpdata1。這個程式還在目錄引數指定的位置上建立一個日誌檔案(同樣在伺服器上)。預設地,這個程式使用一個名稱為 DPUMP_DIR 的目錄;因此可以建立它來代替 DPDATA1。
注意上面的引數 job_name,這是個特殊的引數,在原來的匯出中沒有。所有的 Data Pump 工作都通過作業來完成。Data Pump 作業 ― 與 DBMS 作業不同 ― 只是伺服器程式,它代表主程式處理資料。主程式(稱為主控制程式)通過高階佇列 (AQ) 來協調這項工作;它通過在執行期內建立的一個特殊的表(稱為主表)來實現這個目的。在我們的例子中,如果您在 expdp 執行時檢查使用者 ANANDA 的模式 ,您將注意到一個表 CASES_EXPORT 的存在(對應引數 job_name)。當 expdp 結束時,這個表被丟棄。
匯出監控/
當 Data Pump Export (DPE) 執行時,按 Control-C;它將阻止訊息在螢幕上顯示,但不停止匯出程式本身。相反,它將顯示 DPE 提示符(如下所示)。程式現在被認為處於“互動式”模式:
Export>
這種方法允許在這個 DPE 作業上輸入幾條命令。要檢視概要,在提示符下使用 STATUS 命令:
Export> status
Job:CASES_EXPORT
Operation:EXPORT
Mode:TABLE
State:EXECUTING
Degree: 1
Job Error Count: 0
Dump file:/u02/dpdata1/expCASES.dmp
bytes written = 2048
Worker 1 Status:
State:EXECUTING
Object Schema:DWOWNER
Object Name:CASES
Object Type:TABLE_EXPORT/TBL_TABLE_DATA/TABLE/TABLE_DATA
Completed Objects: 1
Total Objects: 1
Completed Rows: 4687818
記住,這只是狀態顯示。匯出在後臺工作。要繼續在螢幕上檢視訊息,從 Export> 提示符下使用命令 CONTINUE_CLIENT。
並行操作
您可以通過 PARALLEL 引數為匯出使用一個以上的執行緒來顯著地加速作業。每個執行緒建立一個單獨的轉儲檔案,因此引數 dumpfile 應當擁有和並行度一樣多的專案。您可以指定萬用字元作為檔名,而不是顯式地輸入各個檔名,例如:
expdp ananda/abc123 tables=CASES directory=DPDATA1
dumpfile=expCASES_%U.dmp parallel=4 job_name=Cases_Export
注意 dumpfile 引數擁有一個萬用字元 %U,它指示檔案將按需要建立,格式將為 expCASES_nn.dmp,其中 nn 從 01 開始,然後按需要向上增加。
在並行模式下,狀態螢幕將顯示四個工作程式。(在預設模式下,只有一個程式是可見的。)所有的工作程式同步取出資料,並在狀態螢幕上顯示它們的進度。
分離訪問資料檔案和轉儲目錄檔案系統的輸入/輸出通道是很重要的。否則,與維護 Data Pump 作業相關的開銷可能超過並行執行緒的效益,並因此而降低效能。並行方式只有在表的數量多於並行值並且表很大時才是有效的。
資料庫監控
您還可以從資料庫檢視獲得關於執行的 Data Pump 作業的更多資訊。監控作業的主檢視是 DBA_DATAPUMP_JOBS,它將告訴您在作業上有多少個工作程式(列 DEGREE)在工作。另一個重要的檢視是 DBA_DATAPUMP_SESSIONS,當它與上述檢視和 V$SESSION 結合時將給出主前臺程式的會話 SID。
select sid, serial#
from v$session s, dba_datapump_sessions d
where s.saddr = d.saddr;
這條指令顯示前臺程式的會話。更多有用的資訊可以從警報日誌中獲得。當程式啟動時,MCP 和工作程式在警報日誌中顯示如下:
kupprdp:master process DM00 started with pid=23, OS id=20530 to execute -
SYS.KUPM$MCP.MAIN('CASES_EXPORT', 'ANANDA');
kupprdp:worker process DW01 started with worker id=1, pid=24, OS id=20532 to execute -
SYS.KUPW$WORKER.MAIN('CASES_EXPORT', 'ANANDA');
kupprdp:worker process DW03 started with worker id=2, pid=25, OS id=20534 to execute -
SYS.KUPW$WORKER.MAIN('CASES_EXPORT', 'ANANDA');
它顯示為資料泵操作啟動的會話的 PID。您可以用以下查詢找到實際的 SID:
select sid, program from v$session where paddr in
(select addr from v$process where pid in (23,24,25));
PROGRAM 列將對應警報日誌檔案中的名稱顯示程式 DM (為主程式)或 DW (為工作程式)。如果一個工作程式使用了並行查詢,比如說 SID 23,您可以在檢視 V$PX_SESSION 中看到它,並把它找出來。它將為您顯示從 SID 23 代表的工作程式中執行的所有並行查詢會話:
select sid from v$px_session where qcsid = 23;
從檢視 V$SESSION_LONGOPS 中可以獲得其它的有用資訊來預測完成作業將花費的時間。
select sid, serial#, sofar, totalwork
from v$session_longops
where opname = 'CASES_EXPORT'
and sofar != totalwork;
列 totalwork 顯示總工作量,該列的 sofar 數量被加和到當前的時刻 ― 因而您可以用它來估計還要花多長時間。
Data Pump 匯入
不過,資料匯入效能是 Data Pump 真正出色的地方。要匯入先前匯出的資料,我們將使用
impdp ananda/abc123 directory=dpdata1 dumpfile=expCASES.dmp job_name=cases_import
匯入程式的預設行為是建立表和所有相關的物件,然後在表已存在時產生一個錯誤。如果您想把資料新增到一個現有的表中,您可以在上述命令列中使用 TABLE_EXISTS_ACTION=APPEND。
和使用 Data Pump 匯入一樣,在程式中按 Control-C 將進入 Date Pump Import (DPI) 的互動模式;同樣,提示符是 Import>。
處理特定物件
您是否有過只需要從一個使用者匯出特定的過程,以在一個不同的資料庫或使用者中重新建立這些過程的情況?與傳統的匯出實用工具不同,Data Pump 允許您只匯出特定型別的物件。例如,以下命令讓您只匯出過程,而不匯出其它任何東西 ― 不匯出表、檢視、甚至函式:
expdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp include=PROCEDURE
要只匯出一些特定的物件 ― 比如說,函式 FUNC1 和過程 PROC1 ― 您可以使用
expdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp
include=PROCEDURE:"='PROC1'",FUNCTION:"='FUNC1'"
這個轉儲檔案充當了源物件的一個備份。您甚至可以用它來建立 DDL 指令碼,以供之後使用。一個稱為 SQLFILE 的特殊引數允許建立 DDL 指令碼檔案。
impdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp sqlfile=procs.sql
該指令在 DPDATA1 指定的目錄中建立一個名稱為 procs.sql 的檔案,並將物件的指令碼包含在匯出轉儲檔案中。這種方法幫助您快速地在另一個模式中建立源物件。
利用引數 INCLUDE 允許您從轉儲檔案中定義要包含或排除的物件。您可以使用子句 INCLUDE=TABLE:"LIKE 'TAB%'" 來僅匯出那些名稱以 TAB 開頭的表。類似地,您可以使用結構 INCLUDE=TABLE:"NOT LIKE 'TAB%'" 來排除所有名稱以 TAB 開頭的表。作為另一種選擇,您可以使用 EXCLUDE 引數來排除特定的物件。
通過外部表,Data Pump 還可以用來傳輸表空間;它非常強大,能夠即時地重定義並行方式,將更多的表新增到一個現有的程式中等等(這超出了本文的範圍
利用 Oracle Database 10g 實用工具資料移動得到了很大的提高。
迄今為止,匯出/匯入工具集仍是跨多個平臺轉移資料所需勞動強度最小的首選實用工具,儘管人們常常抱怨它速度太慢。匯入只是將每條記錄從匯出轉儲檔案中讀出來,然後使用常見的 INSERT INTO 命令將其插入到目標表中,因此匯入可能是個很慢的過程,這一點並不讓人感到吃驚。
進入 Oracle Data Pump,Oracle Database 10g 中的匯出/匯入工具包的更新更快的同類工具,它被設計來成倍地加速這個過程。
Data Pump 反映了整個匯出/匯入過程的徹底革新。它不是使用常見的 SQL 命令,而是應用專用 API 來以更快得多的速度載入和解除安裝資料。在我的測試中,我看到匯出效能比在直接模式下提高了 10-15 倍,匯入過程效能提高了 5 倍。此外,與使用匯出實用工具不同,它還能夠只取出特定型別的物件(如過程)。
Data Pump 匯出
這個新的實用工具稱為 expdp,以和原來的匯出 exp 區分開。在本例中,我們將用 Data Pump 來匯出一個大表 CASES,大小約為 3GB。Data Pump 在伺服器端使用檔案處理來建立和讀取檔案;因此,目錄作為位置使用。在這種情況下,我們將使用檔案系統 /u02/dpdata1 來儲存轉儲檔案。
create directory dpdata1 as '/u02/dpdata1';
grant read, write on directory dpdata1 to ananda;
接下來,我們將匯出資料:
expdp ananda/abc123 tables=CASES directory=DPDATA1
dumpfile=expCASES.dmp job_name=CASES_EXPORT
讓我們來分析該命令的各個部分。使用者 ID/口令組合、表和轉儲檔案引數的意義是顯而易見的。與原來的匯出不同,檔案是在伺服器(不是客戶端)上建立的。位置由目錄引數值 DPDATA1 指定,它指向之前建立的 /u02/dpdata1。這個程式還在目錄引數指定的位置上建立一個日誌檔案(同樣在伺服器上)。預設地,這個程式使用一個名稱為 DPUMP_DIR 的目錄;因此可以建立它來代替 DPDATA1。
注意上面的引數 job_name,這是個特殊的引數,在原來的匯出中沒有。所有的 Data Pump 工作都通過作業來完成。Data Pump 作業 ― 與 DBMS 作業不同 ― 只是伺服器程式,它代表主程式處理資料。主程式(稱為主控制程式)通過高階佇列 (AQ) 來協調這項工作;它通過在執行期內建立的一個特殊的表(稱為主表)來實現這個目的。在我們的例子中,如果您在 expdp 執行時檢查使用者 ANANDA 的模式 ,您將注意到一個表 CASES_EXPORT 的存在(對應引數 job_name)。當 expdp 結束時,這個表被丟棄。
匯出監控/
當 Data Pump Export (DPE) 執行時,按 Control-C;它將阻止訊息在螢幕上顯示,但不停止匯出程式本身。相反,它將顯示 DPE 提示符(如下所示)。程式現在被認為處於“互動式”模式:
Export>
這種方法允許在這個 DPE 作業上輸入幾條命令。要檢視概要,在提示符下使用 STATUS 命令:
Export> status
Job:CASES_EXPORT
Operation:EXPORT
Mode:TABLE
State:EXECUTING
Degree: 1
Job Error Count: 0
Dump file:/u02/dpdata1/expCASES.dmp
bytes written = 2048
Worker 1 Status:
State:EXECUTING
Object Schema:DWOWNER
Object Name:CASES
Object Type:TABLE_EXPORT/TBL_TABLE_DATA/TABLE/TABLE_DATA
Completed Objects: 1
Total Objects: 1
Completed Rows: 4687818
記住,這只是狀態顯示。匯出在後臺工作。要繼續在螢幕上檢視訊息,從 Export> 提示符下使用命令 CONTINUE_CLIENT。
並行操作
您可以通過 PARALLEL 引數為匯出使用一個以上的執行緒來顯著地加速作業。每個執行緒建立一個單獨的轉儲檔案,因此引數 dumpfile 應當擁有和並行度一樣多的專案。您可以指定萬用字元作為檔名,而不是顯式地輸入各個檔名,例如:
expdp ananda/abc123 tables=CASES directory=DPDATA1
dumpfile=expCASES_%U.dmp parallel=4 job_name=Cases_Export
注意 dumpfile 引數擁有一個萬用字元 %U,它指示檔案將按需要建立,格式將為 expCASES_nn.dmp,其中 nn 從 01 開始,然後按需要向上增加。
在並行模式下,狀態螢幕將顯示四個工作程式。(在預設模式下,只有一個程式是可見的。)所有的工作程式同步取出資料,並在狀態螢幕上顯示它們的進度。
分離訪問資料檔案和轉儲目錄檔案系統的輸入/輸出通道是很重要的。否則,與維護 Data Pump 作業相關的開銷可能超過並行執行緒的效益,並因此而降低效能。並行方式只有在表的數量多於並行值並且表很大時才是有效的。
資料庫監控
您還可以從資料庫檢視獲得關於執行的 Data Pump 作業的更多資訊。監控作業的主檢視是 DBA_DATAPUMP_JOBS,它將告訴您在作業上有多少個工作程式(列 DEGREE)在工作。另一個重要的檢視是 DBA_DATAPUMP_SESSIONS,當它與上述檢視和 V$SESSION 結合時將給出主前臺程式的會話 SID。
select sid, serial#
from v$session s, dba_datapump_sessions d
where s.saddr = d.saddr;
這條指令顯示前臺程式的會話。更多有用的資訊可以從警報日誌中獲得。當程式啟動時,MCP 和工作程式在警報日誌中顯示如下:
kupprdp:master process DM00 started with pid=23, OS id=20530 to execute -
SYS.KUPM$MCP.MAIN('CASES_EXPORT', 'ANANDA');
kupprdp:worker process DW01 started with worker id=1, pid=24, OS id=20532 to execute -
SYS.KUPW$WORKER.MAIN('CASES_EXPORT', 'ANANDA');
kupprdp:worker process DW03 started with worker id=2, pid=25, OS id=20534 to execute -
SYS.KUPW$WORKER.MAIN('CASES_EXPORT', 'ANANDA');
它顯示為資料泵操作啟動的會話的 PID。您可以用以下查詢找到實際的 SID:
select sid, program from v$session where paddr in
(select addr from v$process where pid in (23,24,25));
PROGRAM 列將對應警報日誌檔案中的名稱顯示程式 DM (為主程式)或 DW (為工作程式)。如果一個工作程式使用了並行查詢,比如說 SID 23,您可以在檢視 V$PX_SESSION 中看到它,並把它找出來。它將為您顯示從 SID 23 代表的工作程式中執行的所有並行查詢會話:
select sid from v$px_session where qcsid = 23;
從檢視 V$SESSION_LONGOPS 中可以獲得其它的有用資訊來預測完成作業將花費的時間。
select sid, serial#, sofar, totalwork
from v$session_longops
where opname = 'CASES_EXPORT'
and sofar != totalwork;
列 totalwork 顯示總工作量,該列的 sofar 數量被加和到當前的時刻 ― 因而您可以用它來估計還要花多長時間。
Data Pump 匯入
不過,資料匯入效能是 Data Pump 真正出色的地方。要匯入先前匯出的資料,我們將使用
impdp ananda/abc123 directory=dpdata1 dumpfile=expCASES.dmp job_name=cases_import
匯入程式的預設行為是建立表和所有相關的物件,然後在表已存在時產生一個錯誤。如果您想把資料新增到一個現有的表中,您可以在上述命令列中使用 TABLE_EXISTS_ACTION=APPEND。
和使用 Data Pump 匯入一樣,在程式中按 Control-C 將進入 Date Pump Import (DPI) 的互動模式;同樣,提示符是 Import>。
處理特定物件
您是否有過只需要從一個使用者匯出特定的過程,以在一個不同的資料庫或使用者中重新建立這些過程的情況?與傳統的匯出實用工具不同,Data Pump 允許您只匯出特定型別的物件。例如,以下命令讓您只匯出過程,而不匯出其它任何東西 ― 不匯出表、檢視、甚至函式:
expdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp include=PROCEDURE
要只匯出一些特定的物件 ― 比如說,函式 FUNC1 和過程 PROC1 ― 您可以使用
expdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp
include=PROCEDURE:"='PROC1'",FUNCTION:"='FUNC1'"
這個轉儲檔案充當了源物件的一個備份。您甚至可以用它來建立 DDL 指令碼,以供之後使用。一個稱為 SQLFILE 的特殊引數允許建立 DDL 指令碼檔案。
impdp ananda/iclaim directory=DPDATA1 dumpfile=expprocs.dmp sqlfile=procs.sql
該指令在 DPDATA1 指定的目錄中建立一個名稱為 procs.sql 的檔案,並將物件的指令碼包含在匯出轉儲檔案中。這種方法幫助您快速地在另一個模式中建立源物件。
利用引數 INCLUDE 允許您從轉儲檔案中定義要包含或排除的物件。您可以使用子句 INCLUDE=TABLE:"LIKE 'TAB%'" 來僅匯出那些名稱以 TAB 開頭的表。類似地,您可以使用結構 INCLUDE=TABLE:"NOT LIKE 'TAB%'" 來排除所有名稱以 TAB 開頭的表。作為另一種選擇,您可以使用 EXCLUDE 引數來排除特定的物件。
通過外部表,Data Pump 還可以用來傳輸表空間;它非常強大,能夠即時地重定義並行方式,將更多的表新增到一個現有的程式中等等(這超出了本文的範圍
相關文章
- Oracle 資料匯入匯出Oracle
- Oracle資料匯入匯出Oracle
- Oracle資料庫匯入匯出。imp匯入命令和exp匯出命令Oracle資料庫
- Oracle資料泵的匯入和匯出Oracle
- oracle資料匯出匯入(exp/imp)Oracle
- Oracle資料泵匯出匯入(expdp/impdp)Oracle
- 【oracle 多種形式的外部表匯入、匯出】實驗Oracle
- Activity 流程模型匯入匯出-activity流程模型匯入匯出模型
- Oracle 12c expdp和impdp匯出匯入表Oracle
- 【SQL】Oracle BLOB 批量匯入匯出圖片語句SQLOracle
- oracle 匯入報錯:field in data file exceeds maximum lengthOracle
- Mysql匯入&匯出MySql
- doris匯入匯出
- esayExcel匯入匯出Excel
- 【STATS】Oracle匯入匯出優化器統計資訊Oracle優化
- 【Data Pump】Data Pump的並行引數原理並行
- vue excel匯入匯出VueExcel
- navlicat 匯入匯出SQLSQL
- [Docker核心之容器、資料庫檔案的匯入匯出、容器映象的匯入匯出]Docker資料庫
- Oracle資料泵(Oracle Data Pump) 19cOracle
- Mongodb資料的匯出與匯入MongoDB
- 匯入和匯出AWR的資料
- EasyPoi, Excel資料的匯入匯出Excel
- Angular Excel 匯入與匯出AngularExcel
- sqoop資料匯入匯出OOP
- 資料泵匯出匯入
- .net6 匯入匯出
- phpMyAdmin匯入/匯出資料PHP
- 【docker】docker映象匯出匯入Docker
- ASP.NET 開源匯入匯出庫Magicodes.IE 完成Csv匯入匯出ASP.NET
- Oracle使用資料泵expdp,impdp進行資料匯出匯入Oracle
- Vue框架下實現匯入匯出Excel、匯出PDFVue框架Excel
- MySQL的文字匯入之load data localMySql
- 【oracle 資料匯入匯出字元問題】Oracle字元
- SQL資料庫的匯入和匯出SQL資料庫
- 關於java中Excel的匯入匯出JavaExcel
- EasyExcel完成excel檔案的匯入匯出Excel
- excel的匯入與匯出---通用版Excel
- ES模組化的匯入和匯出