MT和MPT—區塊鏈的資料結構
本文從翻譯Vitalik Buterin 的一篇部落格開始介紹三個概念:
- Merkle Tree: 默克爾樹
- Merkle Patricia Tree: 默克爾帕特里夏樹
- Merkle Proofs: 默克爾證明
概述
Merkle Tree是區塊鏈的一個基礎概念; 雖然可以通過構造包含所有交易的區塊頭的方式而不使用Merkle Tree, 但是如此笨重的設計註定讓區塊鏈無法走的更遠。感謝Merkle Tree讓以太坊可以執行在小型裝置上:智慧手機,平板電腦,甚至是slock.it即將生產的IOT裝置。
Merkle Tree到底是何方神聖?下面我們娓娓道來。
最簡單的Merkle Tree的形式是下圖展示的這種二叉樹。每個節點有兩個孩子, 葉子節點是資料的雜湊值。
為什麼像上圖這樣設計呢? 因為這種結構可以提供一種叫Merkle Proofs的機制。
如上圖所示, Merkle Proofs包含三部分: 待驗證的塊資料的雜湊(如圖中的9Dog:64), 根雜湊(如圖中的6c0a), 驗證路徑(圖中黃色部分: 1FXq:18, ec20, 8f74)。
證明驗證過程:
- 9Dog:64和1Fxq:18 求雜湊。
- 上步結果和ec20求雜湊。
- 上步結果和8f74求雜湊。
- 上步結果和根雜湊(6c0a)比對是否一致。
比特幣中的Merkle Proofs
Merkle Proofs最早應用在比特幣中, 如下圖所示比特幣用所有交易的雜湊構造了一顆Merkle Tree, 而Merkle Tree的根雜湊寫在區塊頭中:
之所以這樣做的目的是因為這種設計可以支援SPV(簡單支付驗證): 為了驗證一筆交易無需下載所有區塊和交易資訊, 只需下載80位元組的區塊頭就可以了。區塊頭包含5類資料:
- 前一個區塊頭的雜湊
- 時間戳
- 挖礦難度
- 工作量證明nonce
- 上一段提到的所有交易組成的Merkle Tree的根雜湊
如果客戶端想驗證一筆交易的可靠性, 只需要按照上述的Merkle Proofs過程提供交易雜湊和路徑, 再經過一系列雜湊運算後比對根雜湊就可以了。
這樣客戶端避免了下載所有區塊資料進行交易驗證的噩夢, 我們稱這種客戶端為輕客戶端。
但是上述過程雖然可以驗證一筆交易的有效性, 但是它無法提供更強大的能力。 例如它無法提供驗證一個賬號當前持有多少資產? 雖然輕客戶端可以查詢多個節點並且通過某種協議保證了至少一個可信節點返回的是真實的資訊來檢視賬戶餘額, 但是這樣做無疑更復雜。
所以為什麼不從一開始的資料結構上就解決這類問題呢? 以太坊設計正是為此而來。
以太坊中的Merkle Proofs
以太坊中的區塊頭包含三顆Merkle Tree, 分別是: 交易樹, 單據樹, 狀態樹。
這種設計使得更復雜的輕客戶端協議成為可能, 甚至可以處理以下問題:
- 這筆交易已經包含在一個區塊了麼? (交易樹可以處理)
- 告訴我過去30天, 這個地址觸發的所有X事件的資訊(類似前一段火爆的ico的智慧合約) (單據樹可以處理)
- 我的賬戶現在有多少餘額? (狀態樹可以處理)
- 這個賬戶是否存在? (狀態樹可以處理)
- 如果執行這筆交易會發生什麼? (比較複雜, 不說明了)
帕特里夏樹
最上面我們介紹了二叉的Merkle Tree形式; 對於交易樹而言這種二叉的資料結構已經非常優秀了, 因為交易樹是一次性計算寫入後再也不會改變的,所以它對計算效率的要求並不高。
但是對於狀態樹情況就比較複雜了, 比如以太坊中的狀態是一個key-value的map。key是賬戶地址, values則包含了每個賬戶的balance,nonce,code 和 storage。下面是測試網路上的狀態資料的描述:
{
"0000000000000000000000000000000000000001": {
"balance": "1"
},
"0000000000000000000000000000000000000002": {
"balance": "1"
},
"0000000000000000000000000000000000000003": {
"balance": "1"
},
"0000000000000000000000000000000000000004": {
"balance": "1"
},
"102e61f5d8f9bc71d0ad4a084df4e65e05ce0e1c": {
"balance": "1606938044258990275541962092341162602522202993782792835301376"
}
}
不同於交易樹, 狀態樹因為交易的發生,賬戶的新增等動作會頻繁的進行插入,更新等操作。如何讓樹的插入和更新變得高效, 我們需要一種新的樹形資料結構,新的資料結果需要具備兩個特性:
- 樹的深度有限,哪怕收到攻擊使得樹的深度持續增加。否則樹深度過大會導致計算緩慢而無法正常服務。
- 樹根雜湊的計算僅依賴資料,不依賴更新的次序。無論對樹更新的次序如何根雜湊的結果是確定的。
帕特里夏樹是最符合我們需求的了, 一句話解釋什麼是帕特里夏樹: 每個節點有16個孩子表示路徑, 分別代表了16進位制的的16個字元。例如path為dog的16進製表示是: 6 4 6 15 6 7, 查詢它的過程就是從根節點開始找到低6個孩子,然後進入下一層對應節點找到第4個孩子…依此類推。
後計
上面是對Vitalik Buterin(以太坊創始人)部落格的翻譯, 整體內容比較淺顯沒有涉及具體的知識點, 算是介紹性的部落格。
下面列一些有價值參考資料:
相關文章
- 區塊鏈中的資料結構之 Merkle Tree區塊鏈資料結構
- 區塊鏈資料總結區塊鏈
- 區塊鏈和資料庫區塊鏈資料庫
- 區塊鏈和大資料的關係區塊鏈大資料
- 區塊鏈(Block Chain)結構解析區塊鏈BloCAI
- 區塊鏈構建資料可信流通體系區塊鏈
- 【許曉笛】EOS 區塊資料結構資料結構
- 區塊鏈:《區塊鏈 技術驅動金融》筆記和總結區塊鏈筆記
- “區塊”和“鏈”的火花,區塊鏈到底為何物區塊鏈
- 區塊鏈代表的資料庫和傳統資料庫有何區別區塊鏈資料庫
- 區塊鏈以及區塊鏈技術總結區塊鏈
- 區塊鏈系列6-區塊鏈安全與大資料區塊鏈大資料
- EOS 區塊鏈資料實時異構到 MongoDB區塊鏈MongoDB
- EOS 區塊鏈資料實時異構到 MySQL區塊鏈MySql
- 區塊鏈2.0架構:以太坊區塊鏈的介紹區塊鏈架構
- 區塊鏈學習資料區塊鏈
- 區塊鏈雲盤的資料安全區塊鏈
- 區塊鏈的架構模型區塊鏈架構模型
- 初識區塊鏈 - 用JS構建你自己的區塊鏈區塊鏈JS
- MPT可以實現輕客戶端和資料追溯通過StateRoot可以查詢到區塊的狀態客戶端
- 架構設計、區塊鏈、人工智慧、大資料架構區塊鏈人工智慧大資料
- 圖資料庫並非要取代區塊鏈,而是讓區塊鏈如虎添翼資料庫區塊鏈
- 區塊鏈的底層架構區塊鏈架構
- 資料結構中樹和森林的區別資料結構
- 區塊鏈與金融的結合區塊鏈
- 區塊鏈技術的領先的區塊鏈數字資產區塊鏈
- 區塊鏈101:區塊鏈的應用和用例是什麼?區塊鏈
- 比特幣和區塊鏈(2):比特幣中區塊鏈的實現比特幣區塊鏈
- 區塊鏈架構設計區塊鏈架構
- SAP HANA和區塊鏈區塊鏈
- 小企業如何利用區塊鏈和大資料獲利?區塊鏈大資料
- 區塊鏈資料管理平臺開發,多節點聯盟區塊鏈搭建區塊鏈
- 區塊鏈社交直播app開發,區塊鏈技術應用資料上鍊區塊鏈APP
- 使用 Swift 和 Vapor 構建區塊鏈伺服器SwiftVapor區塊鏈伺服器
- 區塊鏈開發公司區塊鏈+遊戲”二者結合區塊鏈遊戲
- 比特幣原始碼研讀(2)資料結構-區塊Block比特幣原始碼資料結構BloC
- 區塊鏈與分散式資料庫的比較區塊鏈分散式資料庫
- 比特幣的區塊結構解析比特幣