死磕以太坊原始碼分析之Fetcher同步

mindcarver發表於2020-12-03

原文網址 : https://www.cnblogs.com/1314xf/p/14077604.html

原始碼

死磕以太坊原始碼分析之Fetcher同步

Fetcher 功能概述

區塊資料同步分為被動同步和主動同步:

被動同步是指本地節點收到其他節點的一些廣播的訊息，然後請求區塊資訊。
主動同步是指節點主動向其他節點請求區塊資料，比如geth剛啟動時的syning，以及執行時定時和相鄰節點同步

Fetcher負責被動同步，主要做以下事情：

收到完整的block廣播訊息(NewBlockMsg)
收到blockhash廣播訊息(NewBlockHashesMsg)

這兩個訊息又是分別由 peer.AsyncSendNewBlockHash 和 peer.AsyncSendNewBlock 兩個方法發出的，這兩個方法只有在礦工挖到新的區塊時才會被呼叫：

// 訂閱本地挖到新的區塊的訊息
func (pm *ProtocolManager) minedBroadcastLoop() {
    for obj := range pm.minedBlockSub.Chan() {
        if ev, ok := obj.Data.(core.NewMinedBlockEvent); ok {
            pm.BroadcastBlock(ev.Block, true)  // First propagate block to peers
            pm.BroadcastBlock(ev.Block, false) // Only then announce to the rest
        }
    }
}

func (pm *ProtocolManager) BroadcastBlock(block *types.Block, propagate bool) {
    ......
    if propagate {
        ......
        for _, peer := range transfer {
            peer.AsyncSendNewBlock(block, td) //傳送區塊資料
        }
    }
    if pm.blockchain.HasBlock(hash, block.NumberU64()) {
        for _, peer := range peers {
            peer.AsyncSendNewBlockHash(block) //傳送區塊雜湊
        }
    }
}

所以，當某個礦工產生了新的區塊、並將這個新區塊廣播給其它節點，而其它遠端節點收到廣播的訊息時，才會用到 fetcher 模組去同步這些區塊。

fetcher的狀態欄位

在 Fetcher 內部對區塊進行同步時，會被分成如下幾個階段，並且每個階段都有一個狀態欄位與之對應，用來記錄這個階段的資料：

Fetcher.announced:此階段代表節點宣稱產生了新的區塊（這個新產生的區塊不一定是自己產生的，也可能是同步了其它節點新產生的區塊），Fetcher 物件將相關資訊放到 Fetcher.announced 中，等待下載。
Fetcher.fetching：此階段代表之前「announced」的區塊正在被下載。
Fetcher.fetched：代表區塊的 header 已下載成功，現在等待下載 body。
Fetcher.completing：代表 body 已經發起了下載，正在等待 body 下載成功。
Fetcher.queued:代表 body 已經下載成功。因此一個區塊的資料：header 和 body 都已下載完成，此區塊正在等待寫入本地資料庫。

Fetcher 同步區塊雜湊

而新產生區塊時，會使用訊息 NewBlockHashesMsg 和 NewBlockMsg 對其進行傳播。因此 Fetcher 物件也是從這兩個訊息處發現新的區塊資訊的。先來看同步區塊雜湊的過程。

case msg.Code == NewBlockHashesMsg:
		var announces newBlockHashesData
		if err := msg.Decode(&announces); err != nil {
			return errResp(ErrDecode, "%v: %v", msg, err)
		}
		// Mark the hashes as present at the remote node
		// 將hash 標記存在於遠端節點上
		for _, block := range announces {
			p.MarkBlock(block.Hash)
		}
		// Schedule all the unknown hashes for retrieval 檢索所有未知雜湊
		unknown := make(newBlockHashesData, 0, len(announces))
		for _, block := range announces {
			if !pm.blockchain.HasBlock(block.Hash, block.Number) {
				unknown = append(unknown, block) // 本地不存在的話就扔到unkonwn裡面
			}
		}
		for _, block := range unknown {
			pm.fetcher.Notify(p.id, block.Hash, block.Number, time.Now(), p.RequestOneHeader, p.RequestBodies)
		}

先將接收的雜湊標記在遠端節點上，然後去本地檢索是否有這個雜湊，如果本地資料庫不存在的話，就放到unknown裡面，然後通知本地的fetcher模組再去遠端節點上請求此區塊的header和body。接下來進入到fetcher.Notify方法中。

func (f *Fetcher) Notify(peer string, hash common.Hash, number uint64, time time.Time,
	headerFetcher headerRequesterFn, bodyFetcher bodyRequesterFn) error {
	block := &announce{
		hash:        hash,
		number:      number,
		time:        time,
		origin:      peer,
		fetchHeader: headerFetcher,
		fetchBodies: bodyFetcher,
	}
	select {
	case f.notify <- block:
		return nil
	case <-f.quit:
		return errTerminated
	}

它構造了一個 announce 結構，並將其傳送給了 Fetcher.notify 這個 channel。注意 announce 這個結構裡帶著下載 header 和 body 的方法： fetchHeader 和 fetchBodies 。這兩個方法在下面的過程中會講到。接下來我們進入到fetcher.go的loop函式中，找到notify，分以下幾個內容：

①：校驗防止Dos攻擊(限制為256個)

count := f.announces[notification.origin] + 1
			if count > hashLimit {
				log.Debug("Peer exceeded outstanding announces", "peer", notification.origin, "limit", hashLimit)
				propAnnounceDOSMeter.Mark(1)
				break
			}

②：新來的塊號必須滿足 $chainHeight - blockno < 7$ 或者 $blockno - chainHeight < 32$

if notification.number > 0 {
				if dist := int64(notification.number) - int64(f.chainHeight()); dist < -maxUncleDist || dist > maxQueueDist {
			...			}
			}

③：準備下載header的fetching中存在此雜湊則跳過

if _, ok := f.fetching[notification.hash]; ok { 
  break
			}

④：準備下載body的completing中存在此雜湊也跳過

if _, ok := f.completing[notification.hash]; ok {
				break
			}

⑤：當確定fetching和completing不存在此區塊雜湊時，則把此區塊雜湊放入到announced中，準備拉取header和body。

f.announced[notification.hash] = append(f.announced[notification.hash], notification)

⑥：如果 Fetcher.announced 中只有剛才新加入的這一個區塊雜湊，那麼呼叫 Fetcher.rescheduleFetch 重新設定變數 fetchTimer 的週期

if len(f.announced) == 1 {
				f.rescheduleFetch(fetchTimer)
			}

接下來就是到fetchTimer.C函式中：進行拉取header的操作了,具體步驟如下：

①：選擇要下載的區塊，從 announced 轉移到 fetching 中

for hash, announces := range f.announced {
				if time.Since(announces[0].time) > arriveTimeout-gatherSlack {
				// 隨機挑一個進行fetching
					announce := announces[rand.Intn(len(announces))]
					f.forgetHash(hash)

					// If the block still didn't arrive, queue for fetching
					if f.getBlock(hash) == nil {
						request[announce.origin] = append(request[announce.origin], hash)
						f.fetching[hash] = announce //
					}
				}
			}

②：傳送下載 header 的請求

//傳送所有的header請求
			for peer, hashes := range request {
				log.Trace("Fetching scheduled headers", "peer", peer, "list", hashes)
				fetchHeader, hashes := f.fetching[hashes[0]].fetchHeader, hashes
				go func() {
					if f.fetchingHook != nil {
						f.fetchingHook(hashes)
					}
					for _, hash := range hashes {
						headerFetchMeter.Mark(1)
						fetchHeader(hash) 
					}
				}()
			}

現在我們再回到f.notify函式中，找到p.RequestOneHeader，傳送GetBlockHeadersMsg給遠端節點，然後遠端節點再通過case msg.Code == GetBlockHeadersMsg進行處理，本地區塊鏈會返回headers，然後再傳送回去。

origin = pm.blockchain.GetHeaderByHash(query.Origin.Hash)
...
p.SendBlockHeaders(headers)

這時候我們請求的headers被遠端節點給傳送回來了，又是通過新的訊息BlockHeadersMsg來傳遞的,當請求的 header 到來時，會通過兩種方式來過濾header ：

Fetcher.FilterHeaders 通知 Fetcher 物件

case msg.Code == BlockHeadersMsg:
....
filter := len(headers) == 1
if filter {
  headers = pm.fetcher.FilterHeaders(p.id, headers, time.Now())
}

2.downloader.DeliverHeaders 通知downloader物件

if len(headers) > 0 || !filter {
			err := pm.downloader.DeliverHeaders(p.id, headers)
		...
		}

downloader相關的放在接下的文章探討。繼續看FilterHeaders:

filter := make(chan *headerFilterTask)
	select {
	case f.headerFilter <- filter: ①
....
	select {
	case filter <- &headerFilterTask{peer: peer, headers: headers, time: time}: ②
...
	select {
	case task := <-filter: ③
		return task.headers
...
	}

主要分為3個步驟：

先發一個通訊用的 channel 給 headerFilter
將要過濾的 headerFilterTask 傳送給 filter
檢索過濾後剩餘的標題

主要的處理步驟還是在loop函式中的filter := <-f.headerFilter，在探討處理前，先了解三個引數的含義：

unknown：未知的header
incomplete：header拉取完成，但是body還沒有拉取
complete：header和body都拉取完成，一個完整的塊，可匯入到資料庫

接下來正式進入到for _, header := range task.headers {}迴圈中: 這是第一段重要的迴圈

①：判斷是否是在fetching中的header，並且不是其他同步演算法的header

if announce := f.fetching[hash]; announce != nil && announce.origin == task.peer && f.fetched[hash] == nil && f.completing[hash] == nil && f.queued[hash] == nil {
  .....
}

②：如果傳遞的header與承諾的number不匹配，刪除peer

if header.Number.Uint64() != announce.number {
  f.dropPeer(announce.origin)
		f.forgetHash(hash)
}

③：判斷此區塊在本地是否已存在,如果不存在且只有header（空塊），直接放入complete以及f.completing中，否則就放入到incomplete中等待同步body。

if f.getBlock(hash) == nil {
						announce.header = header
						announce.time = task.time

						if header.TxHash == types.DeriveSha(types.Transactions{}) && header.UncleHash == types.CalcUncleHash([]*types.Header{}) {
				...
							block := types.NewBlockWithHeader(header)
							block.ReceivedAt = task.time

							complete = append(complete, block)
							f.completing[hash] = announce
							continue
            }
						incomplete = append(incomplete, announce) // 否則新增到需要完成拉取body的列表中

④：如果f.fetching中不存在此雜湊，就放入到unkown中

else {
					// Fetcher doesn't know about it, add to the return list |fetcher 不認識的放到unkown中
					unknown = append(unknown, header)
				}

⑤：之後再把Unknown的header再通知fetcher繼續過濾

select {
			case filter <- &headerFilterTask{headers: unknown, time: task.time}:
			case <-f.quit:
				return
		}

接著就是進入到第二個迴圈，要準備拿出incomplete裡的雜湊，進行同步body的同步

for _, announce := range incomplete {
				hash := announce.header.Hash()
				if _, ok := f.completing[hash]; ok {
					continue
				}
				f.fetched[hash] = append(f.fetched[hash], announce)
				if len(f.fetched) == 1 {
					f.rescheduleComplete(completeTimer)
				}
			}

如果f.completing中存在，就表明已經在開始同步body了，直接跳過，否則把這個雜湊放入到f.fetched，表示header同步完畢，準備body同步，由f.rescheduleComplete(completeTimer)完成。最後是安排只有header的區塊進行匯入操作.

for _, block := range complete {
				if announce := f.completing[block.Hash()]; announce != nil {
					f.enqueue(announce.origin, block)
				}
			}

重點分析completeTimer.C，同步body的操作，這步完成就是要準備區塊匯入到資料庫流程了。

拉取body

進入completeTimer.C，從f.fetched獲取雜湊，如果本地區塊鏈查不到的話就把這個雜湊放入到f.completing中，再迴圈進行fetchBodies，整個流程就結束了，程式碼大致如下：

case <-completeTimer.C:
...
			for hash, announces := range f.fetched {
		....
				if f.getBlock(hash) == nil {
					request[announce.origin] = append(request[announce.origin], hash)
					f.completing[hash] = announce
				}
			}
			for peer, hashes := range request {
        ...
				go f.completing[hashes[0]].fetchBodies(hashes)
			}
...

關鍵的拉取body函式： p.RequestBodies，傳送GetBlockBodiesMsg訊息同步body。回到handler裡面去檢視對應的訊息：

case msg.Code == GetBlockBodiesMsg:
		// Decode the retrieval message
		msgStream := rlp.NewStream(msg.Payload, uint64(msg.Size))
		if _, err := msgStream.List(); err != nil {
			return err
		}
		var (
			hash   common.Hash
			bytes  int
			bodies []rlp.RawValue
		)
		for bytes < softResponseLimit && len(bodies) < downloader.MaxBlockFetch {
			...
			if data := pm.blockchain.GetBodyRLP(hash); len(data) != 0 {
				bodies = append(bodies, data)
				bytes += len(data)
			}
		}
		return p.SendBlockBodiesRLP(bodies)

softResponseLimit返回的body大小最大為$2 * 1024 * 1024$,MaxBlockFetch表示每個請求最多128個body。

之後直接通過GetBodyRLP返回資料通過SendBlockBodiesRLP發回給節點。

節點將會接收到新訊息：BlockBodiesMsg，進入檢視：

// 過濾掉filter請求的body 同步，其他的都交給downloader
		filter := len(transactions) > 0 || len(uncles) > 0
		if filter {
			transactions, uncles = pm.fetcher.FilterBodies(p.id, transactions, uncles, time.Now())
		}

		if len(transactions) > 0 || len(uncles) > 0 || !filter {
			err := pm.downloader.DeliverBodies(p.id, transactions, uncles)
...
		}

過濾掉filter請求的body 同步，其他的都交給downloader，downloader部分之後的篇章講。進入到FilterBodies：

	filter := make(chan *bodyFilterTask)
select {
	case f.bodyFilter <- filter:  ①
	case <-f.quit:
		return nil, nil
	}
	// Request the filtering of the body list
	// 請求過濾body 列表
	select { ②
	case filter <- &bodyFilterTask{peer: peer, transactions: transactions, uncles: uncles, time: time}:
	case <-f.quit:
		return nil, nil
	}
	// Retrieve the bodies remaining after filtering
	select { ③：
	case task := <-filter:
		return task.transactions, task.uncles

主要分為3個步驟：

先發一個通訊用的 channel 給 bodyFilter
將要過濾的 bodyFilterTask 傳送給 filter
檢索過濾後剩餘的body

現在進入到case filter := <-f.bodyFilter裡面，大致做了以下幾件事：

①：首先從f.completing中獲取要同步body的雜湊

for i := 0; i < len(task.transactions) && i < len(task.uncles); i++ {
  for hash, announce := range f.completing {
    ...
  }
}

②：然後從f.queued去查這個雜湊是不是已經獲取了body，如果沒有並滿足條件就建立一個完整block

if f.queued[hash] == nil {
						txnHash := types.DeriveSha(types.Transactions(task.transactions[i]))
						uncleHash := types.CalcUncleHash(task.uncles[i])
  if txnHash == announce.header.TxHash && uncleHash == announce.header.UncleHash && announce.origin == task.peer {
							matched = true

							if f.getBlock(hash) == nil {
								block := types.NewBlockWithHeader(announce.header).WithBody(task.transactions[i], task.uncles[i])
								block.ReceivedAt = task.time

                blocks = append(blocks, block)
              }
  }

③：最後對完整的塊進行匯入

for _, block := range blocks {
				if announce := f.completing[block.Hash()]; announce != nil {
					f.enqueue(announce.origin, block)
				}
			}

最後用一張粗略的圖來大概的描述一下整個同步區塊雜湊的流程：

同步區塊雜湊的最終會走到f.enqueue裡面，這個也是同步區塊最重要的要做的一件事，下文就會講到。

Fetcher 同步區塊

分析完上面比較複雜的同步區塊雜湊過程，接下來就要分析比較簡單的同步區塊過程。從NewBlockMsg開始：

主要做兩件事：

①：fetcher模組匯入遠端節點發過來的區塊

pm.fetcher.Enqueue(p.id, request.Block)

②：主動同步遠端節點

if _, td := p.Head(); trueTD.Cmp(td) > 0 {
			p.SetHead(trueHead, trueTD)
			currentBlock := pm.blockchain.CurrentBlock()
			if trueTD.Cmp(pm.blockchain.GetTd(currentBlock.Hash(), currentBlock.NumberU64())) > 0 {
				go pm.synchronise(p)
			}
		}

主動同步由Downloader去處理，我們這篇只討論fetcher相關。

區塊入佇列

pm.fetcher.Enqueue(p.id, request.Block)

case op := <-f.inject:
			propBroadcastInMeter.Mark(1)
			f.enqueue(op.origin, op.block)

正式進入將區塊送進queue中，主要做了以下幾件事：

①：確保新加peer沒有導致DOS攻擊

count := f.queues[peer] + 1
	if count > blockLimit {
		log.Debug("Discarded propagated block, exceeded allowance", "peer", peer, "number", block.Number(), "hash", hash, "limit", blockLimit)
		propBroadcastDOSMeter.Mark(1)
		f.forgetHash(hash)
		return
	}

②：丟棄掉過去的和比較老的區塊

if dist := int64(block.NumberU64()) - int64(f.chainHeight()); dist < -maxUncleDist || dist > maxQueueDist {
  f.forgetHash(hash)
}

③：安排區塊匯入

	if _, ok := f.queued[hash]; !ok {
		op := &inject{
			origin: peer,
			block:  block,
		}
		f.queues[peer] = count
		f.queued[hash] = op
		f.queue.Push(op, -int64(block.NumberU64()))
		if f.queueChangeHook != nil {
			f.queueChangeHook(op.block.Hash(), true)
		}
		log.Debug("Queued propagated block", "peer", peer, "number", block.Number(), "hash", hash, "queued", f.queue.Size())
	}

到此為止，已經將區塊送入到queue中，接下來就是要回到loop函式中去處理queue中的區塊。

區塊入庫

loop函式在處理佇列中的區塊主要做了以下事情：

判斷佇列是否為空
取出區塊雜湊，並且和本地鏈進行比較，如果太高的話，就暫時不匯入
最後通過f.insert將區塊插入到資料庫。

程式碼如下：

height := f.chainHeight()
		for !f.queue.Empty() {
			op := f.queue.PopItem().(*inject)
			hash := op.block.Hash()
		...
			number := op.block.NumberU64()
			if number > height+1 {
				f.queue.Push(op, -int64(number))
	...
				break
			}
			if number+maxUncleDist < height || f.getBlock(hash) != nil {
				f.forgetBlock(hash)
				continue
			}
			f.insert(op.origin, op.block) //匯入塊
		}

進入到f.insert中，主要做了以下幾件事：

①：判斷區塊的父塊是否存在，不存在則中斷插入

		parent := f.getBlock(block.ParentHash())
		if parent == nil {
			log.Debug("Unknown parent of propagated block", "peer", peer, "number", block.Number(), "hash", hash, "parent", block.ParentHash())
			return
		}

②：快速驗證header，並在傳遞時廣播該塊

switch err := f.verifyHeader(block.Header()); err {
		case nil:
			propBroadcastOutTimer.UpdateSince(block.ReceivedAt)
			go f.broadcastBlock(block, true)

③：執行真正的插入邏輯

if _, err := f.insertChain(types.Blocks{block}); err != nil {
			log.Debug("Propagated block import failed", "peer", peer, "number", block.Number(), "hash", hash, "err", err)
			return
		}

④：匯入成功廣播此塊

go f.broadcastBlock(block, false)

真正做區塊入庫的是f.insertChain，這裡會呼叫blockchain模組去操作，具體細節會後續文章講述，到此為止Fether模組的同步就到此結束了，下面是同步區塊的流程圖：

參考

https://mindcarver.cn

https://github.com/blockchainGuide

死磕以太坊原始碼分析之downloader同步
2020-12-23
原始碼
死磕以太坊原始碼分析之state
2021-01-13
原始碼
死磕以太坊原始碼分析之txpool
2020-12-25
原始碼
死磕以太坊原始碼分析之MPT樹-上
2021-01-04
原始碼
死磕以太坊原始碼分析之rlpx協議
2020-11-24
原始碼協議
死磕以太坊原始碼分析之挖礦流程分析
2020-12-12
原始碼
死磕以太坊原始碼分析之Kademlia演算法
2020-11-22
原始碼演算法
死磕以太坊原始碼分析之EVM指令集
2021-02-21
原始碼
以太坊原始碼分析(35)eth-fetcher原始碼分析
2018-05-14
原始碼
死磕以太坊原始碼分析之區塊上鍊入庫
2020-12-24
原始碼
死磕以太坊原始碼分析之Ethash共識演算法
2020-12-18
原始碼演算法
死磕以太坊原始碼分析之EVM如何呼叫ABI編碼的外部方法
2021-02-25
原始碼
死磕以太坊原始碼分析之p2p節點發現
2020-11-23
原始碼
死磕以太坊原始碼分析之EVM固定長度資料型別表示
2021-02-23
原始碼資料型別
死磕 jdk原始碼之HashMap原始碼分析
2019-04-13
JDK原始碼HashMap
以太坊之Fetcher(收到BlockHash的處理)
2021-09-09
BloC
死磕 java集合之TreeSet原始碼分析
2019-04-16
Java原始碼
死磕 java集合之WeakHashMap原始碼分析
2019-04-13
JavaHashMap原始碼
死磕 java集合之LinkedList原始碼分析
2019-05-03
Java原始碼
死磕 java集合之ConcurrentLinkedQueue原始碼分析
2019-04-27
Java原始碼
死磕 java集合之PriorityQueue原始碼分析
2019-04-20
Java原始碼
死磕 java集合之ArrayList原始碼分析
2019-04-01
Java原始碼
死磕 java集合之HashMap原始碼分析
2019-04-01
JavaHashMap原始碼
死磕 java集合之CopyOnWriteArrayList原始碼分析
2019-04-01
Java原始碼
死磕 java集合之LinkedHashMap原始碼分析
2019-04-01
JavaHashMap原始碼
以太坊原始碼分析(37)eth以太坊協議分析
2018-05-14
原始碼協議
以太坊原始碼分析(18)以太坊交易執行分析
2018-05-13
原始碼
死磕 java集合之ConcurrentHashMap原始碼分析（一）
2019-04-08
JavaHashMap原始碼
以太坊原始碼分析(36)ethdb原始碼分析
2018-05-14
原始碼
以太坊原始碼分析(38）event原始碼分析
2018-05-14
原始碼
以太坊原始碼分析(41）hashimoto原始碼分析
2018-05-14
原始碼
以太坊原始碼分析(43）node原始碼分析
2018-05-14
原始碼
以太坊原始碼分析(51）rpc原始碼分析
2018-05-14
原始碼RPC
以太坊原始碼分析(52）trie原始碼分析
2018-05-14
原始碼
以太坊原始碼分析(13)RPC分析
2018-05-13
原始碼RPC
以太坊交易池原始碼分析
2020-10-15
原始碼
死磕 java併發包之AtomicInteger原始碼分析
2019-05-06
Java原始碼
死磕 java併發包之LongAdder原始碼分析
2019-05-12
Java原始碼

死磕以太坊原始碼分析之Fetcher同步

Fetcher 功能概述

fetcher的狀態欄位

Fetcher 同步區塊雜湊

拉取header

拉取body

Fetcher 同步區塊

區塊入佇列

區塊入庫

參考

相關文章