PostgreSQL 資料頁Page解析(2)- 頁頭和行資料指標

husthxd發表於2018-07-22

本文簡單介紹了PG資料頁Page中儲存的原始內容以及如何閱讀它們,包括頁頭PageHeader和行資料指標ItemId(Line Pointer)。

一、測試資料

-- 建立一張表,插入幾行資料

drop table if exists t_page;

create table t_page (id int,c1 char(8),c2 varchar(16));

insert into t_page values(1,'1','a');

insert into t_page values(2,'2','b');

insert into t_page values(3,'3','c');

insert into t_page values(4,'4','d');

-- 獲取該表對應的資料檔案

testdb=# select pg_relation_filepath('t_page');

pg_relation_filepath

----------------------

base/16477/24801

(1 row)

-- Dump資料檔案中的資料

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801

00000000  01 00 00 00 88 20 2a 12  00 00 00 00 28 00 60 1f  |..... *.....(.`.|

00000010  00 20 04 20 00 00 00 00  d8 9f 4e 00 b0 9f 4e 00  |. . ......N...N.|

00000020  88 9f 4e 00 60 9f 4e 00  00 00 00 00 00 00 00 00  |..N.`.N.........|

00000030  00 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

*

00001f60  e5 1b 18 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

00001f70  04 00 03 00 02 08 18 00  04 00 00 00 13 34 20 20  |.............4  |

00001f80  20 20 20 20 20 05 64 00  e4 1b 18 00 00 00 00 00  |     .d.........|

00001f90  00 00 00 00 00 00 00 00  03 00 03 00 02 08 18 00  |................|

00001fa0  03 00 00 00 13 33 20 20  20 20 20 20 20 05 63 00  |.....3       .c.|

00001fb0  e3 1b 18 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|

00001fc0  02 00 03 00 02 08 18 00  02 00 00 00 13 32 20 20  |.............2  |

00001fd0  20 20 20 20 20 05 62 00  e2 1b 18 00 00 00 00 00  |     .b.........|

00001fe0  00 00 00 00 00 00 00 00  01 00 03 00 02 08 18 00  |................|

00001ff0  01 00 00 00 13 31 20 20  20 20 20 20 20 05 61 00  |.....1       .a.|

00002000

二、PageHeader

上一節提到過PageHeaderData,其資料結構如下:

typedef struct PageHeaderData

{

/* XXX LSN is member of *any* block, not only page-organized ones */

PageXLogRecPtr pd_lsn; /* LSN: next byte after last byte of xlog

* record for last change to this page */

uint16 pd_checksum; /* checksum */

uint16 pd_flags; /* flag bits, see below */

LocationIndex pd_lower; /* offset to start of free space */

LocationIndex pd_upper; /* offset to end of free space */

LocationIndex pd_special; /* offset to start of special space */

uint16 pd_pagesize_version;

TransactionId pd_prune_xid; /* oldest prunable XID, or zero if none */

ItemIdData pd_linp[1]; /* beginning of line pointer array */

}  PageHeaderData;

下面根據資料檔案中的資料使用hexdump檢視並逐個進行解析。

pd_lsn(8bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 0 -n 8

00000000  01 00 00 00 88 20 2a 12                           |..... *.|

00000008

資料檔案的8個Bytes儲存的是LSN,其中最開始的4個Bytes是TimelineID,在這裡是\x0000 0001(即數字1),後面的4個Bytes是\x122a2088,組合起來LSN為1/122A2088

注意:

A、0000000&0000008是hexdump工具的輸出,不是資料內容

B、X86使用小端模式,閱讀位元組碼時注意高低位變換

pd_checksum(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 8 -n 2

00000008  00 00                                             |..|

0000000a

checksum為\x0000

pd_flags(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 10 -n 2

0000000a  00 00                                             |..|

0000000c

flags為\x0000

pd_lower(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 12 -n 2

0000000c  28 00                                             |(.|

0000000e

lower為\x0028,十進位制值為40

pd_upper(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 14 -n 2

0000000e  60 1f                                             |`.|

00000010

[xdb@localhost utf8db]$ echo $((0x1f60))

8032

upper為\x1f60,十進位制為8032

pd_special(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 16 -n 2

00000010  00 20                                             |. |

00000012

Special Space為\x2000,十進位制值為8192

pd_pagesize_version(2bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 18 -n 2

00000012  04 20                                             |. |

00000014

pagesize_version為\x2004,十進位制為8196(即版本4)

pd_prune_xid(4bytes)

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 20 -n 4

00000014  00 00 00 00                                       |....|

00000018

prune_xid為\x0000,即0

三、ItemIds

PageHeaderData之後是ItemId陣列,每個元素佔用的空間為4Bytes,資料結構:

typedef struct ItemIdData

{

unsigned lp_off:15,/* offset to tuple (from start of page) */

               lp_flags:2,/* state of item pointer, see below */

              lp_len:15;/* byte length of tuple */

} ItemIdData;

typedef ItemIdData* ItemId;

lp_off

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 24 -n 2

00000018  d8 9f                                             |..|

0000001a

取低15位

[xdb@localhost utf8db]$ echo $((0x9fd8 & ~$((1<<15))))

8152

表示第1個Item(tuple)從8152開始

lp_len

[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 26 -n 2

0000001a  4e 00                                             |N.|

0000001c

取高15位

[xdb@localhost utf8db]$ echo $((0x004e >> 1))

39

表示第1個Item(tuple)的大小為39

lp_flags

取第17-16位,01,即1

四、小結

以上簡單介紹瞭如何閱讀Raw Datafile,包括頁頭和資料行指標資訊,有興趣的同學可在此基礎上實現自己的“pageinspect"。下一節將介紹資料行資訊。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/6906/viewspace-2158305/,如需轉載,請註明出處,否則將追究法律責任。

相關文章