技術前刊:PostgreSQL12 COPY和bulkloading提升

yzs87發表於2019-06-15

業務是否依賴COPY命令載入資料?PostgreSQL12提供了一個新特性,大大加快了載入速度。

COPY:Loading and unloading data as fast as possible

細看PostgreSQL12的COPY語法,發現有兩處變動:

1)\h 會有手冊文件連結

2)COPY支援WHERE條件

下面是完整語法:

db12=# \h COPY
Command:     COPY
Description: copy data between a file and a table
Syntax:
COPY table_name [ ( column_name [, ...] ) ]
    FROM { 'filename' | PROGRAM 'command' | STDIN }
    [ [ WITH ] ( option [, ...] ) ]
    [ WHERE condition ]
COPY { table_name [ ( column_name [, ...] ) ] | ( query ) }
    TO { 'filename' | PROGRAM 'command' | STDOUT }
    [ [ WITH ] ( option [, ...] ) ]
where option can be one of:
    FORMAT format_name
    FREEZE [ boolean ]
    DELIMITER 'delimiter_character'
    NULL 'null_string'
    HEADER [ boolean ]
    QUOTE 'quote_character'
    ESCAPE 'escape_character'
    FORCE_QUOTE { ( column_name [, ...] ) | * }
    FORCE_NOT_NULL ( column_name [, ...] )
    FORCE_NULL ( column_name [, ...] )
    ENCODING 'encoding_name'
URL: 

雖然新增文件連結功能帶來便利,但是WHERE過濾功能更加有用。這個功能的目的是什麼?當前,COPY只能匯入整個檔案。但是某些場景下會有問題:很多場景下,人們只想載入資料的一個子集,並且在匯出前必須編寫大量程式碼進行過濾。

COPY...WHERE:  匯入時過濾

PostgreSQL透過該條件可以輕鬆地進行過濾。下面講述一個簡單的例子:

db12=# CREATE TABLE t_demo AS
        SELECT * FROM generate_series(1, 1000) AS id;
SELECT 1000

首先先插入1000行資料,然後匯出到一個檔案:

db12=# COPY t_demo TO '/tmp/file.txt';
COPY 1000

最後,再重新匯入資料:

db12=# CREATE TABLE t_import (x int);
CREATE TABLE
db12=# COPY t_import FROM '/tmp/file.txt' WHERE x < 5;
COPY 4
db12=# SELECT * FROM t_import;
 x
---
 1
 2
 3
 4
(4 rows)

如上說是,過濾資料非常簡單直接。需要注意,匯出列是“id”,匯入列是“x”。檔案檔案不知道匯入表的表結構---需要確保過濾匯入表的列名。

其他特性

COPY可以將資料傳送到UNIX pipe,還可以從pipe中讀取資料。如下所示:

db12=# COPY t_demo TO PROGRAM 'gzip -c > /tmp/file.txt.gz';
COPY 1000
db12=# COPY t_import FROM PROGRAM 'gunzip -c /tmp/file.txt.gz'
    WHERE x BETWEEN 100 AND 103;
COPY 4
db12=# SELECT * FROM t_import WHERE x >= 100;
  x  
-----
 100
 101
 102
 103
(4 rows)

某些場景下,不止想將資料匯出。上面場景,我們想匯出資料時將資料壓縮;匯入時將資料解壓並過濾。如上所示,這種方法非常簡單。

原文

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31493717/viewspace-2647768/,如需轉載,請註明出處,否則將追究法律責任。

相關文章