MT和MPT—區塊鏈的資料結構

布布發表於2018-03-21

原文網址 : https://flycode.co/archives/112071

本文從翻譯Vitalik Buterin 的一篇部落格開始介紹三個概念:

Merkle Tree: 默克爾樹
Merkle Patricia Tree: 默克爾帕特里夏樹
Merkle Proofs: 默克爾證明

概述

Merkle Tree是區塊鏈的一個基礎概念; 雖然可以通過構造包含所有交易的區塊頭的方式而不使用Merkle Tree, 但是如此笨重的設計註定讓區塊鏈無法走的更遠。感謝Merkle Tree讓以太坊可以執行在小型裝置上:智慧手機,平板電腦,甚至是slock.it即將生產的IOT裝置。
Merkle Tree到底是何方神聖?下面我們娓娓道來。

最簡單的Merkle Tree的形式是下圖展示的這種二叉樹。每個節點有兩個孩子, 葉子節點是資料的雜湊值。

為什麼像上圖這樣設計呢? 因為這種結構可以提供一種叫Merkle Proofs的機制。

如上圖所示, Merkle Proofs包含三部分: 待驗證的塊資料的雜湊(如圖中的9Dog:64), 根雜湊(如圖中的6c0a), 驗證路徑(圖中黃色部分: 1FXq:18, ec20, 8f74)。

證明驗證過程:

9Dog:64和1Fxq:18 求雜湊。
上步結果和ec20求雜湊。
上步結果和8f74求雜湊。
上步結果和根雜湊(6c0a)比對是否一致。

比特幣中的Merkle Proofs

Merkle Proofs最早應用在比特幣中, 如下圖所示比特幣用所有交易的雜湊構造了一顆Merkle Tree, 而Merkle Tree的根雜湊寫在區塊頭中:

之所以這樣做的目的是因為這種設計可以支援SPV(簡單支付驗證): 為了驗證一筆交易無需下載所有區塊和交易資訊, 只需下載80位元組的區塊頭就可以了。區塊頭包含5類資料:

前一個區塊頭的雜湊
時間戳
挖礦難度
工作量證明nonce
上一段提到的所有交易組成的Merkle Tree的根雜湊

如果客戶端想驗證一筆交易的可靠性, 只需要按照上述的Merkle Proofs過程提供交易雜湊和路徑, 再經過一系列雜湊運算後比對根雜湊就可以了。
這樣客戶端避免了下載所有區塊資料進行交易驗證的噩夢, 我們稱這種客戶端為輕客戶端。

但是上述過程雖然可以驗證一筆交易的有效性, 但是它無法提供更強大的能力。例如它無法提供驗證一個賬號當前持有多少資產? 雖然輕客戶端可以查詢多個節點並且通過某種協議保證了至少一個可信節點返回的是真實的資訊來檢視賬戶餘額, 但是這樣做無疑更復雜。
所以為什麼不從一開始的資料結構上就解決這類問題呢? 以太坊設計正是為此而來。

以太坊中的Merkle Proofs

以太坊中的區塊頭包含三顆Merkle Tree, 分別是: 交易樹, 單據樹, 狀態樹。

這種設計使得更復雜的輕客戶端協議成為可能, 甚至可以處理以下問題:

這筆交易已經包含在一個區塊了麼? (交易樹可以處理)
告訴我過去30天, 這個地址觸發的所有X事件的資訊(類似前一段火爆的ico的智慧合約) (單據樹可以處理)
我的賬戶現在有多少餘額? (狀態樹可以處理)
這個賬戶是否存在? (狀態樹可以處理)
如果執行這筆交易會發生什麼? (比較複雜, 不說明了)

帕特里夏樹

最上面我們介紹了二叉的Merkle Tree形式; 對於交易樹而言這種二叉的資料結構已經非常優秀了, 因為交易樹是一次性計算寫入後再也不會改變的,所以它對計算效率的要求並不高。

但是對於狀態樹情況就比較複雜了, 比如以太坊中的狀態是一個key-value的map。key是賬戶地址, values則包含了每個賬戶的balance,nonce,code 和 storage。下面是測試網路上的狀態資料的描述:

{
    "0000000000000000000000000000000000000001": {
        "balance": "1"
    },
    "0000000000000000000000000000000000000002": {
        "balance": "1"
    },
    "0000000000000000000000000000000000000003": {
        "balance": "1"
    },
    "0000000000000000000000000000000000000004": {
        "balance": "1"
    },
    "102e61f5d8f9bc71d0ad4a084df4e65e05ce0e1c": {
        "balance": "1606938044258990275541962092341162602522202993782792835301376"
    }
}

不同於交易樹, 狀態樹因為交易的發生,賬戶的新增等動作會頻繁的進行插入,更新等操作。如何讓樹的插入和更新變得高效, 我們需要一種新的樹形資料結構,新的資料結果需要具備兩個特性:

樹的深度有限,哪怕收到攻擊使得樹的深度持續增加。否則樹深度過大會導致計算緩慢而無法正常服務。
樹根雜湊的計算僅依賴資料,不依賴更新的次序。無論對樹更新的次序如何根雜湊的結果是確定的。

帕特里夏樹是最符合我們需求的了, 一句話解釋什麼是帕特里夏樹: 每個節點有16個孩子表示路徑, 分別代表了16進位制的的16個字元。例如path為dog的16進製表示是: 6 4 6 15 6 7, 查詢它的過程就是從根節點開始找到低6個孩子,然後進入下一層對應節點找到第4個孩子…依此類推。

後計

上面是對Vitalik Buterin(以太坊創始人)部落格的翻譯, 整體內容比較淺顯沒有涉及具體的知識點, 算是介紹性的部落格。

下面列一些有價值參考資料:

原文
 帕特里夏樹
 字典樹
 MPT

區塊鏈中的資料結構之 Merkle Tree
2018-08-20
區塊鏈資料結構
區塊鏈資料總結
2018-08-06
區塊鏈
區塊鏈和資料庫
2018-04-16
區塊鏈資料庫
區塊鏈和大資料的關係
2022-05-17
區塊鏈大資料
區塊鏈（Block Chain）結構解析
2018-05-14
區塊鏈BloCAI
區塊鏈構建資料可信流通體系
2023-04-19
區塊鏈
【許曉笛】EOS 區塊資料結構
2018-11-20
資料結構
區塊鏈：《區塊鏈技術驅動金融》筆記和總結
2018-07-22
區塊鏈筆記
“區塊”和“鏈”的火花，區塊鏈到底為何物
2018-09-03
區塊鏈
區塊鏈代表的資料庫和傳統資料庫有何區別
2018-05-30
區塊鏈資料庫
區塊鏈以及區塊鏈技術總結
2018-07-09
區塊鏈
區塊鏈系列6-區塊鏈安全與大資料
2018-08-07
區塊鏈大資料
EOS 區塊鏈資料實時異構到 MongoDB
2018-11-18
區塊鏈MongoDB
EOS 區塊鏈資料實時異構到 MySQL
2018-07-06
區塊鏈MySql
區塊鏈2.0架構：以太坊區塊鏈的介紹
2018-08-16
區塊鏈架構
區塊鏈學習資料
2018-03-10
區塊鏈
區塊鏈雲盤的資料安全
2020-08-15
區塊鏈
區塊鏈的架構模型
2022-03-22
區塊鏈架構模型
初識區塊鏈 - 用JS構建你自己的區塊鏈
2018-12-04
區塊鏈JS
MPT可以實現輕客戶端和資料追溯通過StateRoot可以查詢到區塊的狀態
2022-04-02
客戶端
架構設計、區塊鏈、人工智慧、大資料
2018-07-03
架構區塊鏈人工智慧大資料
圖資料庫並非要取代區塊鏈，而是讓區塊鏈如虎添翼
2018-12-13
資料庫區塊鏈
區塊鏈的底層架構
2018-08-13
區塊鏈架構
區塊鏈與金融的結合
2018-08-08
區塊鏈
資料結構中樹和森林的區別
2024-04-15
資料結構
區塊鏈技術的領先的區塊鏈數字資產
2023-12-07
區塊鏈
區塊鏈101：區塊鏈的應用和用例是什麼?
2018-04-17
區塊鏈
比特幣和區塊鏈(2)：比特幣中區塊鏈的實現
2018-04-18
比特幣區塊鏈
區塊鏈架構設計
2018-03-15
區塊鏈架構
SAP HANA和區塊鏈
2019-01-16
區塊鏈
小企業如何利用區塊鏈和大資料獲利?
2018-07-16
區塊鏈大資料
區塊鏈資料管理平臺開發,多節點聯盟區塊鏈搭建
2019-11-08
區塊鏈
區塊鏈社交直播app開發,區塊鏈技術應用資料上鍊
2019-12-10
區塊鏈APP
使用 Swift 和 Vapor 構建區塊鏈伺服器
2019-03-04
SwiftVapor區塊鏈伺服器
區塊鏈開發公司區塊鏈+遊戲”二者結合
2018-09-28
區塊鏈遊戲
比特幣原始碼研讀(2)資料結構-區塊Block
2018-04-25
比特幣原始碼資料結構BloC
區塊鏈與分散式資料庫的比較
2022-03-04
區塊鏈分散式資料庫
比特幣的區塊結構解析
2018-04-17
比特幣

MT和MPT—區塊鏈的資料結構

概述

比特幣中的Merkle Proofs

以太坊中的Merkle Proofs

帕特里夏樹

後計

相關文章