技術前刊:PostgreSQL12 COPY和bulkloading提升
業務是否依賴COPY命令載入資料?PostgreSQL12提供了一個新特性,大大加快了載入速度。
COPY:Loading and unloading data as fast as possible
細看PostgreSQL12的COPY語法,發現有兩處變動:
1)\h 會有手冊文件連結
2)COPY支援WHERE條件
下面是完整語法:
db12=# \h COPY Command: COPY Description: copy data between a file and a table Syntax: COPY table_name [ ( column_name [, ...] ) ] FROM { 'filename' | PROGRAM 'command' | STDIN } [ [ WITH ] ( option [, ...] ) ] [ WHERE condition ] COPY { table_name [ ( column_name [, ...] ) ] | ( query ) } TO { 'filename' | PROGRAM 'command' | STDOUT } [ [ WITH ] ( option [, ...] ) ] where option can be one of: FORMAT format_name FREEZE [ boolean ] DELIMITER 'delimiter_character' NULL 'null_string' HEADER [ boolean ] QUOTE 'quote_character' ESCAPE 'escape_character' FORCE_QUOTE { ( column_name [, ...] ) | * } FORCE_NOT_NULL ( column_name [, ...] ) FORCE_NULL ( column_name [, ...] ) ENCODING 'encoding_name' URL:
雖然新增文件連結功能帶來便利,但是WHERE過濾功能更加有用。這個功能的目的是什麼?當前,COPY只能匯入整個檔案。但是某些場景下會有問題:很多場景下,人們只想載入資料的一個子集,並且在匯出前必須編寫大量程式碼進行過濾。
COPY...WHERE: 匯入時過濾
PostgreSQL透過該條件可以輕鬆地進行過濾。下面講述一個簡單的例子:
db12=# CREATE TABLE t_demo AS SELECT * FROM generate_series(1, 1000) AS id; SELECT 1000
首先先插入1000行資料,然後匯出到一個檔案:
db12=# COPY t_demo TO '/tmp/file.txt'; COPY 1000
最後,再重新匯入資料:
db12=# CREATE TABLE t_import (x int); CREATE TABLE db12=# COPY t_import FROM '/tmp/file.txt' WHERE x < 5; COPY 4 db12=# SELECT * FROM t_import; x --- 1 2 3 4 (4 rows)
如上說是,過濾資料非常簡單直接。需要注意,匯出列是“id”,匯入列是“x”。檔案檔案不知道匯入表的表結構---需要確保過濾匯入表的列名。
其他特性
COPY可以將資料傳送到UNIX pipe,還可以從pipe中讀取資料。如下所示:
db12=# COPY t_demo TO PROGRAM 'gzip -c > /tmp/file.txt.gz'; COPY 1000 db12=# COPY t_import FROM PROGRAM 'gunzip -c /tmp/file.txt.gz' WHERE x BETWEEN 100 AND 103; COPY 4 db12=# SELECT * FROM t_import WHERE x >= 100; x ----- 100 101 102 103 (4 rows)
某些場景下,不止想將資料匯出。上面場景,我們想匯出資料時將資料壓縮;匯入時將資料解壓並過濾。如上所示,這種方法非常簡單。
原文
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31493717/viewspace-2647768/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Linux I/O 原理和 Zero-copy 技術全面揭祕Linux
- ELSE 技術週刊(2017.12.04期)
- ELSE 技術週刊(2017.12.18期)
- ELSE 技術週刊(2017.11.20期)
- ELSE 技術週刊(2017.12.11期)
- ELSE 技術週刊(2017.10.30期)
- ELSE 技術週刊(2017.11.13期)
- ELSE 技術週刊(2017.09.25期)
- ELSE 技術週刊(2018.01.08期)
- ELSE 技術週刊(2017.10.16期)
- ELSE 技術週刊(2017.11.27期)
- ELSE 技術週刊(2018.03.12期)
- ELSE 技術週刊(2017.10.23期)
- 如何提升web前端技術?Web前端
- 技術週刊(2019-04-08)
- 蒲公英 · JELLY技術週刊 Vol.21 -- 技術週刊 · React Hooks vs Vue 3 + Composition APIReactHookVueAPI
- BetterFE 前端技術週刊 - 2019/03/25前端
- BetterFE 前端技術週刊 - 2019/02/25前端
- BetterFE 前端技術週刊 – 2019/01/02前端
- 技術週刊(2018-11-26 WebSocket)Web
- 技術週刊(2019-02-11 Serverless)Server
- 【朝夕技術專刊】RabbitMQ路由解析(上篇)MQ路由
- 技術週刊(2019-01-28 VSCode)VSCode
- BetterFE 前端技術週刊 - 2019/01/02前端
- Copy of a Copy of a Copy
- Linux--寫時複製(Copy-On-Write,COW)技術簡述Linux
- 如何快速提升你的技術能力
- SegmentFault 思否技術週刊 Vol.78 — Git 必看技術補給Git
- DDFE 技術週刊(第十二期)2017.1.23
- FCC 成都社群·技術週刊 第 14 期
- 前端技術週刊 2018-12-03:DOM前端
- 前端技術週刊 2018-09-03:parser前端
- 技術週刊 · Lighthouse 測試報告生成測試報告
- DDFE 技術週刊(第十五期)2017.2.21
- 前端技術週刊 Apr 15th, 2018前端
- 技術更迭,一往無前
- PHP開發人員技術提升心得PHP
- 利用DDP技術提升Tungsten Fabric vRouter效能VR