深入理解React:diff 演算法

forcheng發表於2020-07-05

目錄

  • 序言
  • React 的核心思想
  • 傳統 diff 演算法
  • React diff
    • 兩個假設
    • 三個策略
    • diff 具體優化
      • tree diff
      • component diff
      • element diff
  • 小結
  • 參考

1.序言

此篇文章所討論的是 React 16 以前的 Diff 演算法。而 React 16 啟用了全新的架構 Fiber,相應的 Diff 演算法也有所改變,不在這篇文章的討論範圍內。研究 React 的 Diff 演算法重在理解其思想,具體實現其次。


2.React 的核心思想

React 最為核心的就是 Virtual DOM 和 Diff 演算法。React 在記憶體中維護一顆虛擬 DOM 樹,當資料發生改變時(state & props),會自動的更新虛擬 DOM,獲得一個新的虛擬 DOM 樹,然後通過 Diff 演算法,比較新舊虛擬 DOM 樹,找出最小的有變化的部分,將這個變化的部分(Patch)加入佇列,最終批量的更新這些 Patch 到實際的 DOM 中。


3.傳統 diff 演算法

將一顆 Tree 通過最小操作步數對映為另一顆 Tree,這種演算法稱之為 Tree Edit Distance(樹編輯距離)。如圖:

上圖中,最小操作步數(編輯距離)為 3:

  1. 刪除 ul 節點
  2. 新增 span 節點
  3. 新增 text 節點

而 Tree Edit Distance 演算法從 1979 年到 2011年,經過了30多年的發展演變,其時間複雜度最終被優化到 O(n^3),其發展歷程大致如下(n 是樹中節點的總數):

  1. 1979年,Tai 提出了次個非冪級複雜度演算法,時間複雜度為 O(m3*n3)
  2. 1989年,Zhang and Shasha 將 Tai 的演算法進行優化,時間複雜度為 O(m2*n2)
  3. 1998年,Klein 將 Zhang and Shasha 的演算法再次優化,時間複雜度為 O(n^2*m*log(m))
  4. 2009年,Demiane 提出最壞情況下的計算公式,將時間複雜度控制在 O(n^2*m*(1+log(m/n)))
  5. 2011年,Pawlik and N.Augsten 提出適用於所有形狀的樹的演算法,並將時間複雜度控制在 O(n^3)

這裡不會展開討論 Tree Edit Distance 演算法的具體實現和原理,有興趣可以直接看這篇論文 A Robust Algorithm for the Tree Edit Distance


4.React diff

傳統 diff 演算法其時間複雜度最優解是 O(n^3),那麼如果有 1000 個節點,則一次 diff 就將進行 10 億次比較,這顯然無法達到高效能的要求。而 React 通過大膽的假設,並基於假設提出相關策略,成功的將 O(n^3) 複雜度的問題轉化為 O(n) 複雜度的問題。


(1)兩個假設

為了優化 diff 演算法,React 提出了兩個假設:

  1. 兩個不同型別的元素會產生出不同的樹
  2. 開發者可以通過 key prop 來暗示哪些子元素在不同的渲染下能保持穩定

(2)三個策略

基於這上述兩個假設,React 針對性的提出了三個策略以對 diff 演算法進行優化:

  1. Web UI 中 DOM 節點跨層級的移動操作特別少,可以忽略不計
  2. 擁有相同型別的兩個元件將會生成相似的樹形結構,擁有不同型別的兩個元件將會生成不同樹形結構
  3. 對於同一層級的一組子節點,它們可以通過唯一 key 進行區分

(3)diff 具體優化

基於上述三個策略,React 分別對以下三個部分進行了 diff 演算法優化

  • tree diff
  • component diff
  • element diff

tree diff

React 只對虛擬 DOM 樹進行分層比較,不考慮節點的跨層級比較。如下圖:

分層比較

如上圖,React 通過 updateDepth 對虛擬 Dom 樹進行層級控制,只會對相同顏色框內的節點進行比較,根據對比結果,進行節點的新增和刪除。如此只需要遍歷一次虛擬 Dom 樹,就可以完成整個的對比。


如果發生了跨層級的移動操作,如下圖:

跨層級的移動操作

通過分層比較可知,React 並不會複用 B 節點及其子節點,而是會直接刪除 A 節點下的 B 節點,然後再在 C 節點下建立新的 B 節點及其子節點。因此,如果發生跨級操作,React 是不能複用已有節點,可能會導致 React 進行大量重新建立操作,這會影響效能。所以 React 官方推薦儘量避免跨層級的操作。


component diff

React 是基於元件構建的,對於元件間的比較所採用的策略如下:

  • 如果是同型別元件,首先使用 shouldComponentUpdate()方法判斷是否需要進行比較,如果返回true,才比較對應的虛擬 DOM 節點,否則不需要比較
  • 如果是不同型別的元件,則將該元件判斷為 dirty component,從而替換整個元件下的所有子節點

不同型別的元件比較

如上圖,雖然元件 C 和元件 H 結構相似,但型別不同,React 不會進行比較,會直接刪除元件 C,建立元件 H。


從上述 component diff 策略可以知道:

  1. 對於不同型別的元件,預設不需要進行比較操作,直接重新建立。
  2. 對於同型別元件, 通過讓開發人員自定義shouldComponentUpdate()方法來進行比較優化,減少元件不必要的比較。如果沒有自定義,shouldComponentUpdate()方法預設返回true,預設每次元件發生資料(state & props)變化時,都會進行比較。

element diff

element diff 涉及三種操作:移動、建立、刪除。對於同一層級的子節點,對於是否使用 key 分別進行討論。


對於不使用 key 的情況,如下圖:

不使用 key 的情況

React 對新老同一層級的子節點對比,發現新集合中的 B 不等於老集合中的 A,於是刪除 A,建立 B,依此類推,直到刪除 D,建立 C。這會使得相同的節點不能複用,出現頻繁的刪除和建立操作,從而影響效能。


對於使用 key 的情況,如下圖:

使用 key 的情況

React 首先會對新集合進行遍歷,通過唯一 key 來判斷老集合中是否存在相同的節點,如果沒有則建立,如果有的,則判斷是否需要進行移動操作。並且 React 對於移動操作也採用了比較高效的演算法,使用了一種順序優化手段,這裡不做詳細討論。


從上述可知,element diff 就是通過唯一 key 來進行 diff 優化,通過複用已有的節點,減少節點的刪除和建立操作。


5.小結

React 通過大膽的假設,制定對應的 diff 策略,將 O(n3) 複雜度的問題轉換成 O(n) 複雜度的問題

  • 通過分層對比策略,對 tree diff 進行演算法優化
  • 通過相同類生成相似樹形結構,不同類生成不同樹形結構以及shouldComponentUpdate策略,對 component diff 進行演算法優化
  • 通過設定唯一 key 策略,對 element diff 進行演算法優化

6.參考

React - 協調

Deep In React之淺談 React Fiber 架構(一)

react16的diff演算法相比於react15有什麼改動?

React 原始碼剖析系列 - 不可思議的 react diff

傳統diff演算法的演算法複雜度為什麼是o(n3)?

相關文章