PostgreSQL Page頁結構解析(2)- 頁頭和行資料指標
本文簡單介紹了PG資料頁Page中儲存的原始內容以及如何閱讀它們,包括頁頭PageHeader和行資料指標ItemId(Line Pointer)。
一、測試資料
-- 建立一張表,插入幾行資料
drop table if exists t_page;
create table t_page (id int,c1 char(8),c2 varchar(16));
insert into t_page values(1,'1','a');
insert into t_page values(2,'2','b');
insert into t_page values(3,'3','c');
insert into t_page values(4,'4','d');
-- 獲取該表對應的資料檔案
testdb=# select pg_relation_filepath('t_page');
pg_relation_filepath
----------------------
base/16477/24801
(1 row)
-- Dump資料檔案中的資料
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801
00000000 01 00 00 00 88 20 2a 12 00 00 00 00 28 00 60 1f |..... *.....(.`.|
00000010 00 20 04 20 00 00 00 00 d8 9f 4e 00 b0 9f 4e 00 |. . ......N...N.|
00000020 88 9f 4e 00 60 9f 4e 00 00 00 00 00 00 00 00 00 |..N.`.N.........|
00000030 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
*
00001f60 e5 1b 18 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
00001f70 04 00 03 00 02 08 18 00 04 00 00 00 13 34 20 20 |.............4 |
00001f80 20 20 20 20 20 05 64 00 e4 1b 18 00 00 00 00 00 | .d.........|
00001f90 00 00 00 00 00 00 00 00 03 00 03 00 02 08 18 00 |................|
00001fa0 03 00 00 00 13 33 20 20 20 20 20 20 20 05 63 00 |.....3 .c.|
00001fb0 e3 1b 18 00 00 00 00 00 00 00 00 00 00 00 00 00 |................|
00001fc0 02 00 03 00 02 08 18 00 02 00 00 00 13 32 20 20 |.............2 |
00001fd0 20 20 20 20 20 05 62 00 e2 1b 18 00 00 00 00 00 | .b.........|
00001fe0 00 00 00 00 00 00 00 00 01 00 03 00 02 08 18 00 |................|
00001ff0 01 00 00 00 13 31 20 20 20 20 20 20 20 05 61 00 |.....1 .a.|
00002000
二、PageHeader
上一節提到過PageHeaderData,其資料結構如下:
typedef struct PageHeaderData
{
/* XXX LSN is member of *any* block, not only page-organized ones */
PageXLogRecPtr pd_lsn; /* LSN: next byte after last byte of xlog
* record for last change to this page */
uint16 pd_checksum; /* checksum */
uint16 pd_flags; /* flag bits, see below */
LocationIndex pd_lower; /* offset to start of free space */
LocationIndex pd_upper; /* offset to end of free space */
LocationIndex pd_special; /* offset to start of special space */
uint16 pd_pagesize_version;
TransactionId pd_prune_xid; /* oldest prunable XID, or zero if none */
ItemIdData pd_linp[1]; /* beginning of line pointer array */
} PageHeaderData;
下面根據資料檔案中的資料使用hexdump檢視並逐個進行解析。
pd_lsn(8bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 0 -n 8
00000000 01 00 00 00 88 20 2a 12 |..... *.|
00000008
資料檔案的8個Bytes儲存的是LSN,其中最開始的4個Bytes是TimelineID,在這裡是\x0000 0001(即數字1),後面的4個Bytes是\x122a2088,組合起來LSN為1/122A2088
注意:
A、0000000&0000008是hexdump工具的輸出,不是資料內容
B、X86使用小端模式,閱讀位元組碼時注意高低位變換
pd_checksum(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 8 -n 2
00000008 00 00 |..|
0000000a
checksum為\x0000
pd_flags(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 10 -n 2
0000000a 00 00 |..|
0000000c
flags為\x0000
pd_lower(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 12 -n 2
0000000c 28 00 |(.|
0000000e
lower為\x0028,十進位制值為40
pd_upper(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 14 -n 2
0000000e 60 1f |`.|
00000010
[xdb@localhost utf8db]$ echo $((0x1f60))
8032
upper為\x1f60,十進位制為8032
pd_special(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 16 -n 2
00000010 00 20 |. |
00000012
Special Space為\x2000,十進位制值為8192
pd_pagesize_version(2bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 18 -n 2
00000012 04 20 |. |
00000014
pagesize_version為\x2004,十進位制為8196(即版本4)
pd_prune_xid(4bytes)
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 20 -n 4
00000014 00 00 00 00 |....|
00000018
prune_xid為\x0000,即0
三、ItemIds
PageHeaderData之後是ItemId陣列,每個元素佔用的空間為4Bytes,資料結構:
typedef struct ItemIdData
{
unsigned lp_off:15,/* offset to tuple (from start of page) */
lp_flags:2,/* state of item pointer, see below */
lp_len:15;/* byte length of tuple */
} ItemIdData;
typedef ItemIdData* ItemId;
lp_off
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 24 -n 2
00000018 d8 9f |..|
0000001a
取低15位
[xdb@localhost utf8db]$ echo $((0x9fd8 & ~$((1<<15))))
8152
表示第1個Item(tuple)從8152開始
lp_len
[xdb@localhost utf8db]$ hexdump -C $PGDATA/base/16477/24801 -s 26 -n 2
0000001a 4e 00 |N.|
0000001c
取高15位
[xdb@localhost utf8db]$ echo $((0x004e >> 1))
39
表示第1個Item(tuple)的大小為39
lp_flags
取第17-16位,01,即1
四、小結
以上簡單介紹瞭如何閱讀Raw Datafile,包括頁頭和資料行指標資訊,有興趣的同學可在此基礎上實現自己的“pageinspect"。下一節將介紹資料行資訊。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/6906/viewspace-2374922/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- PostgreSQL 資料頁Page解析(2)- 頁頭和行資料指標SQL指標
- PostgreSQL Page頁結構解析(3)- 行資料SQL
- PostgreSQL Page頁結構解析(1)-基礎SQL
- PostgreSQL Page頁結構解析(6)- B-Tree索引儲存結構#2SQL索引
- PostgreSQL 資料頁Page解析(1)- 基礎SQL
- PostgreSQL Page頁結構解析(4)- 執行DML時表佔用空間解析SQL
- PostgreSQL Page頁結構解析(5)- B-Tree索引儲存結構#1SQL索引
- PostgreSQL Page頁結構解析(7)- B-Tree索引儲存結構#3SQL索引
- InnoDB資料頁結構
- 給定json資料,將資料與頁面結構進行繫結JSON
- PostgreSQL儲存引擎之page結構SQL儲存引擎
- 資料結構專題頁(更新中...)資料結構
- 透過結構化資料構建頁面
- 如何從零學習PostgreSQL Page結構SQL
- 【SqlServer】 理解資料庫中的資料頁結構SQLServer資料庫
- 【Mysql】InnoDB 引擎中的資料頁結構MySql
- 帝國CMS動態頁分頁函式page1解析說明函式
- 資料結構和演算法面試題系列—C指標、陣列和結構體資料結構演算法面試題指標陣列結構體
- LiteDB原始碼解析系列(2)資料庫頁詳解原始碼資料庫
- PostgreSQL DBA(9) - 執行計劃資料結構SQL資料結構
- 資料結構與演算法基礎之指標和陣列資料結構演算法指標陣列
- Postgresql資料庫體系結構-程式和記憶體結構SQL資料庫記憶體
- excel列印每頁都有標題和表頭怎麼去掉 Excel表格每頁都顯示錶頭Excel
- Oracle 標準大頁和透明大頁Oracle
- router跳轉page頁面
- Python爬蟲教程-18-頁面解析和資料提取Python爬蟲
- SQL Server Page資料庫結構深入分析SQLServer資料庫
- Flutter實戰 從頭擼一個「孤島」APP(No.2、閃屏Splash Page、引導頁)FlutterAPP
- MySQL 執行原理【資料頁】MySql
- [提問交流]請問列表頁呼叫article:page標籤如何實現分頁樣式定製.
- SQL Server資料庫怎麼找出一個表包含的頁資訊(Page)SQLServer資料庫
- 網頁抓取五種常用的HTTP標頭網頁HTTP
- Android Paging分頁庫的學習(一)—— 結合本地資料進行分頁載入Android
- PG技術大講堂 - 第13講:PostgreSQL Full-Page Writes 全頁寫SQL
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- Xamarin 學習筆記 - Page(頁面)筆記
- (一)如何使用 Parsel 和 XPath 進行網頁資料提取網頁
- Android Paging分頁庫的學習(二)—— 結合Room資料庫進行分頁載入AndroidOOM資料庫