PostgreSQL MVCC 原始碼實現

jesselyu發表於2015-04-19

      MVCC對每一個DBA來講,都不陌生,即多版本控制(Multi-Version-Control)。正因為資料有了多個版本,才實現了讀和寫在一定程度上的分離,提高資料庫每秒處理查詢的能力(QPS)。

使用者發起的普通查詢請求(不包含select … for update語句),並不堵塞DML事務。在Read Commit事務隔離級別時,查詢請求只讀取查詢請求之前已經提交的事務的資料更改,對當前版本的資料並不影響;

而DML語句,會操作當前版本。因此做到了讀寫分離的目的,提高資料庫併發能力。

      不同的資料庫,實現MVCC的方法不同。Oracle和MySQL Innodb 儲存引擎類似的使用undo來實現。

      對於PostgreSQL資料庫來講,他沒有undo,那麼,PG又是怎麼來實現他自己的MVCC呢?又有那些優缺點呢?

 

     PG用copy tuple和tuple的xmin,xmax,cmin,cmax等標記來實現多版本。

     xmin:在建立記錄(tuple)時,記錄此時,後面每次update也會更新。

     xmax: 在刪除tuple或者lock時,記錄此時;如果記錄沒有被刪除,那麼此時為0。

     cmin和cmax:主要為標識在同一個事務中多個語句命令的序列值。用於同一個事務中實現版本可見性判斷。

 

1.下面我們先來看一下xmin和xmax的變化:

image

從上圖可以看出,4條記錄的xmin是一樣的,都是“390689”,這說明是在同一個事務中建立的。另外xmax都為“0”,說明都沒有被刪除。cmin和cmax都是1,說明是同一個命令建立的。

接下來,我們update一下id為1的記錄,看發生什麼情況:

update之後,並沒有提交,重新開起另外一個視窗,查詢:

image

我們看到,ID為1的記錄,只有xmin沒有變化,其它三個值都發生了變化,其中xmax變成了”390691”。

然後我把事務提交掉,再在新視窗中查詢:

image

我們看到,提交後,ID 為1的記錄,xmin變為“390691”,xmin增加了1;而xmax變成了0。

 

從上面的案例中,我們從表面上可以看出,xmin增加了。但是事實上,PostgreSQL在底層所做的事情,遠比這個要多。底層已經生成了一個新版本的tuple,新版本tuple的xmin等於老版本的xmax。

詳細的internal,我後面再展開講。

 

2.我們再來看一下cmin和cmax的變化:

我起一個事務,包含兩條update,一條update ID值為2的記錄,一條insert ID值為3的記錄:

image

事務“390694”中,cmin和cmax的值,依次遞增。從目前來看cmin和cmax實際上是同一個field。

原始碼定義如下,用union實現了CommandId,是一個combo command id。

image

 

因此,從上面的例子來看,PostgreSQL的mvcc實現是比較簡單的。只需要透過對比tuple header中xmin,xmax,cmin,cmax與當前的xid,就可以得到在scan tuple時,此tuple對於當前查詢的可視性。

可見性判斷邏輯:

image

 

但是也帶來了另外一個問題:就是在沒有undo的情況下,會導致空間的增長。因此PostgreSQL引入了vacumm後臺程式,來定期清理這些 DEAD tuple。

關於vacumm的原理,我後面開寫一篇文章。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30088583/viewspace-1585695/,如需轉載,請註明出處,否則將追究法律責任。

相關文章