InnoDB從內分析之Row（一）

so_easy發表於2020-09-17

原文網址 : https://learnku.com/articles/49759?order_by=created_at&

前言

時學時總結，有不全和錯誤還請指正！

先來看一張MySQL內部資料結構相關的簡圖：
InnoDB從內分析（一）
從已上圖從上至下可以看到幾個概念：

Tablespace：表空間
Segment：段
Extent：區
Page：頁
Row：行
簡短意賅的說明就是：我們寫的資料儲存在Row，然後Row又儲存在Page，Page儲存在Extent，Extent儲存在了Segment，最終Segment又儲存在了Tablespace。
從大致上解讀如上，如果在細一點的分析可以看到以上圖還有更多的資訊，如：
Tablespace下有：Leaf node segment-葉子段，Non-Leaf node segment-非葉子段，Rollback segment-回滾段。
Row下有：Trx id-事務ID，Roll Pointer-回滾指標，Col1..Coln-資料欄位
除了以上的概念之外，還有很多的資訊從圖中無法得知。這就需要我們自己去學習和理解。而我就是嘗試去寫這些東西讓自己能夠理解這些東西。我打算從下至上的去講述，可能並不是特別深入，好在能夠有個大致的瞭解。

Row-資料行

我們通過insert語句寫入的一條資料謂之為行。
假設我們建立了一張資料表：

CREATE TABLE `test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `name` varchar(12) NOT NULL DEFAULT '',
  PRIMARY KEY (`id`),
  KEY `idx_name` (`name`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;

並且寫入了一些資料：

insert into `test` set `id`=1,`name`='張三';
insert into `test` set `id`=2,`name`='李四';

這些資料理所當然的存在了MySQL的“工作目錄”，而且也可以通過簡單的sql語句查詢得到我們要的資料。但是MySQL是如何儲存和查詢這些資料呢？這就需要先了解Row的資料結構。

行格式分為幾種：在5.0之前用的是Redundant，5.0之後用的是Compact。那麼首先先講講Compact。

Compact格式

InnoDB從內分析（一）
從上圖可以看到組成資料行的基本構成。這些基本的構成怎麼就可以用來儲存我們的行記錄呢？請繼續往下看。

Compact的記錄頭資訊：
InnoDB從內分析（一）
記錄頭資訊一共佔用了40bit。這40bit該如何充分利用呢？為了解釋這些位元組的作用，繼續以圖說明：

1Byte=8bit：一個英文字元佔用1Byte。一個漢字佔用2Byte。

看如下的例子建立了一張資料表，並且插入一些資料行：
InnoDB從內分析（一）
這些插入的資料是以二進位制儲存的，如果轉成16進位制部分資料如下圖，這部分的資料則是從第一行資料開始的。

根據圖中的解釋已經可以大致瞭解了一行記錄對應的Compact資料結構。

MySQL是如何知道第一行資料的起始位置呢？

從上圖還可以得到一些資訊：

三個隱藏的列欄位：RowID(佔6B)，TransactionID(佔6B)即TrxID，和Roll Pointer(佔7B)。
變長欄位03 02 01逆序：從表結構知道t1 t2 t4是變長欄位，分別對應第一行記錄的a bb ccc，長度分別是01 02 03。而在資料儲存的時候卻是以逆序儲存，為什麼呢？因為行記錄查詢過程是以記錄頭資訊開始查詢行記錄的。
NULL標誌位(佔1B)：從記錄頭資訊往前1B就是NULL標誌位。如第三行記錄出現了NULL值，NULL標誌位為06，對應成二進位制則是0000 0110。對應1的位置表示是NULL值，也即表示2、3列兩個欄位是NULL值。剩下的2個字元則不是NULL值，再往前取兩個字元則分別為第4、1列的長度。
next_record：下一行記錄頭資訊的位置，類似指標指向下一條記錄。通過記錄頭資訊的欄位佔用說明為16bit，即00 2b，用16進製表示為0x2b。注意到當前的位置是0x81，和0x2b相加為：0xac。看向0xac這一行的字元是：2b。沒錯，你發現了它就是下一條記錄頭資訊的next_record。以此也就可以形成一個資料行單向連結串列。

（1）疑問：如果欄位定義了超過8個NULL值欄位，該如何儲存呢？
（2）表示變長段這裡是用1B，用二進位制表示是：0000 0000。表示成十進位制則取值範圍在：0~2^8-1(255)。倘若varchar定義的變長大於255呢？則用2B表示，最大長度在0~2^16-1(65535)。65535這也就是一個變長字串最大的長度了。
（3）NULL值除了標誌位佔了1B，實際不存在其他佔用。
（4）設定為char型別的欄位在不足長度時，會以0x20佔位。這也說明了某些情況下char型別可能會存在空間浪費，而varchar不會。

InnoDB從內分析（一）

Redundant格式

格式如下截圖：

InnoDB從內分析（一）

記錄頭資訊的截圖如下：
InnoDB從內分析（一）

從中可以得到幾點資訊：

n_fields(10bit)：記錄中列的數量，佔用10bit。很好的解釋了為什麼行中最多有1023個列。
1byte_offs_flag：偏移列表為1B還是2B。什麼意思呢？
頭資訊佔用的是48bit。

同樣以示例來解讀：

InnoDB從內分析（一）

InnoDB從內分析（一）
將行記錄的二進位制轉成十六進位制檢視如下圖：

InnoDB從內分析（一）

分析Redundant和Compact的異同：
（1）Compact的存的是變長欄位長度列表，而Redundant存的是欄位長度偏移列表。這也就意味著從header開始查詢欄位值的策略也就發生了改變。但它們都是逆序儲存。
（2）處理NULL值的策略不同。Compact專門用1B記錄NULL值的列位置所在，Redundant沒有。但它是如何記錄NULL值的呢？看到第三行資料的儲存。
逆序偏移量列表：21 9e 94 14 13 0c 06。從header開始往後數06B是RowID，從RowID繼續往後數0x0c-0x06=0x06即06B則是TxId。0x13-0x0c=0x07即roll_pointer，三個隱藏列則數完了。0x14-0x13=0x01即1B的字元d。從這突然跳到0x94，0x9e-0x94=0x0a即10B的NULL值，接下來就是0x21-0x9e=0x03的3Bfff。
Compact對NULL值是不佔用儲存的，而Redundant的char型別還是需要佔用儲存空間。所以Compact較之Redundant算是優化了。

字符集和char的關係

我們經常會用char(2)的形式給一個欄位的定長。這個長度2在MySQL4.1之前是表示2個位元組，而之後則表示的是2個字元。2個字元的長度那到底是佔多少位元組呢？這個和MySQL的字符集相關。

latin1 ：英文字元佔用1B。
GBK：英文字元佔用1B，中文字元佔用2B。
utf8：英文字元佔用1B，中文字元佔用3B。
所以在某些情況下看似都是2個字元，但是佔用的位元組卻是不同的。這也就說明了為什麼在MySQL4.1之後char型別也被視為varchar型別，且佔用的位元組長度會被記錄在變長欄位長度列表。值得注意的是在前面的例子中並沒有發現被視為varchar型別，那是因為前面的例子選用的字符集是latin1。

varchar的最大長度

（1）之前提到過varchar的最大長度可以是65535位元組，但是實際上並達不到這個長度。通過測試發現最大長度只可為65532位元組（當然，這不是我做的實驗，感興趣可以自己嘗試）。
（2）在一個值得注意的是65535的長度指的是位元組長度，這個也和字符集相關。不同的字符集中英文字元佔用的位元組不同，但是總的位元組長度不可超過65535即可。
（3）較之於Oracle VARCHAR2最大存放4000位元組，SQL Server最大存放8000位元組，MySQL最大可存放65532位元組！然而需要注意的是這個65535位元組並不是指每個欄位都可設定為65535，而是一行記錄的總長度最大為65535。比如下圖：

InnoDB從內分析（一）
（4）資料頁1頁大小是16KB，即16384B。這怎麼夠存入一個varchar為36652位元組的欄位呢？這裡就必須提到一個概念行溢位。行溢位顧名思義就是：一行放不下產生溢位了。

行溢位

首先看看Compact和Redundant對行溢位的表示：
InnoDB從內分析（一）
在記錄中最大儲存768B，剩下的就是用指標指向行溢位頁。
對於儲存長欄位的話我們會用varchar,text,blob等型別。使用了長欄位表示並不一定就會產生行溢位。那麼什麼情況下會產生行溢位呢？

也就是說一頁中至少可以存放兩條記錄，否則就會產生行溢位。經過試驗發現一行的最大長度是varchar(8098)。