[譯] React效能優化-虛擬Dom原理淺析

Yuying_Wu發表於2019-03-02
bkg.jpg

本文譯自《Optimizing React: Virtual DOM explained》,作者是Alexey IvanovAndy Barnov,來自Evil Martians’ team團隊。

譯者說:通過一些實際場景和demo,給大家描述React的Virtual Dom Diff一些核心的原理和規則,以及基於這些我們可以做些什麼提高應用的效能,很棒的文章。


通過學習React的Virtual DOM的知識,去加速你們的應用吧。對框架內部實現的介紹,比較全面且適合初學者,我們會讓JSX更加簡單易懂,給你展示React是如何判斷要不要重新render,解釋如何找到應用的效能瓶頸,以及給大家一些小貼士,如何避免常見錯誤。

React在前端圈內保持領先的原因之一,因為它的學習曲線非常平易近人:把你的模板包在JSX,瞭解一下propsstate的概念之後,你就可以輕鬆寫出React程式碼了。

如果你已經熟悉React的工作方式,可以直接跳至“優化我的程式碼”篇。

但要真正掌握React,你需要像React一樣思考(think in React)。本文也會試圖在這個方面幫助你。

下面看看我們其中一個專案中的React table:

ebay_table.png

這個表裡有數百個動態(表格內容變化)和可過濾的選項,理解這個框架更精細的點,對於保證順暢的使用者體驗至關重要。


當事情出錯時,你一定能感覺到。輸入欄位變得遲緩,核取方塊需要檢查一秒鐘,彈窗一個世紀後才出現,等等。


為了能夠解決這些問題,我們需要完成一個React元件的整個生命旅程,從一開始的宣告定義到在頁面上渲染(再然後可能會更新)。繫好安全帶,我們要發車了!

JSX的背後

這個過程一般在前端會稱為“轉譯”,但其實“彙編”將是一個更精確的術語。

React開發人員敦促你在編寫元件時使用一種稱為JSX的語法,混合了HTML和JavaScript。但瀏覽器對JSX及其語法毫無頭緒,瀏覽器只能理解純碎的JavaScript,所以JSX必須轉換成JavaScript。這裡是一個div的JSX程式碼,它有一個class name和一些內容:

<div className=`cn`>
  Content!
</div>
複製程式碼

以上的程式碼,被轉換成“正經”的JavaScript程式碼,其實是一個帶有一些引數的函式呼叫:

React.createElement(
  `div`,
  { className: `cn` },
  `Content!`
);
複製程式碼

讓我們仔細看看這些引數。

  • 第一個是元素的type。對於HTML標籤,它將是一個帶有標籤名稱的字串。
  • 第二個引數是一個包含所有元素屬性(attributes)的物件。如果沒有,它也可以是空的物件。
  • 剩下的引數都可以認為是元素的子元素(children)。元素中的文字也算作一個child,是個字串`Content!` 作為函式呼叫的第三個引數放置。

你應該可以想象,當我們有更多的children時會發生什麼:

<div className=`cn`>
  Content 1!
  <br />
  Content 2!
</div>
複製程式碼
React.createElement(
  `div`,
  { className: `cn` },
  `Content 1!`,              // 1st child
  React.createElement(`br`), // 2nd child
  `Content 2!`               // 3rd child
)
複製程式碼

我們的函式現在有五個引數:

  • 一個元素的型別
  • 一個屬性物件
  • 三個子元素。

因為其中一個child是一個React已知的HTML標籤(<br/>),所以它也會被描述為一個函式呼叫(React.createElement(`br`))。

到目前為止,我們已經涵蓋了兩種型別的children:

  • 簡單的String
  • 另一種會呼叫React.createElement

然而,還有其他值可以作為引數:

  • 基本型別 false, null, undefined, true
  • 陣列
  • React Components

可以使用陣列是因為可以將children分組並作為一個引數傳遞:

React.createElement(
  `div`,
  { className: `cn` },
  [`Content 1!`, React.createElement(`br`), `Content 2!`]
)
複製程式碼

當然了,React的厲害之處,不僅僅因為我們可以把HTML標籤直接放在JSX中使用,而是我們可以自定義自己的元件,例如:

function Table({ rows }) {
  return (
    <table>
      {rows.map(row => (
        <tr key={row.id}>
          <td>{row.title}</td>
        </tr>
      ))}
    </table>
  );
}
複製程式碼

元件可以讓我們把模板分解為多個可重用的塊。在上面的“函式式”(functional)元件的例子裡,我們接收一個包含表格行資料的物件陣列,最後返回一個呼叫React.createElement方法的<table>元素,rows則作為children傳進table。

無論什麼時候,我們這樣去宣告一個元件時:

<Table rows={rows} />
複製程式碼

從瀏覽器的角度來看,我們是這麼寫的:

React.createElement(Table, { rows: rows });
複製程式碼

注意,這次我們的第一個引數不是String描述的HTML標籤,而是一個引用,指向我們編寫元件時編寫的函式。元件的attributes現在是接收的props引數了。

把元件(components)組合成頁面(a page)

所以,我們已經將所有JSX元件轉換為純JavaScript,現在我們有一大堆函式呼叫,它的引數會被其他函式呼叫的,或者還有更多的其他函式呼叫這些引數……這些帶引數的函式呼叫,是怎麼轉化成組成這個頁面的實體DOM的呢?

為此,我們有一個ReactDOM庫及其它的render方法:

function Table({ rows }) { /* ... */ } // defining a component

// rendering a component
ReactDOM.render(
  React.createElement(Table, { rows: rows }), // "creating" a component
  document.getElementById(`#root`) // inserting it on a page
);
複製程式碼

ReactDOM.render被呼叫時,React.createElement最終也會被呼叫,返回以下物件:

// There are more fields, but these are most important to us
{
  type: Table,
  props: {
    rows: rows
  },
  // ...
}
複製程式碼

這些物件,在React的角度上,構成了虛擬DOM。


他們將在所有進一步的渲染中相互比較,並最終轉化為 真正的DOM(virtual VS real, 虛擬DOM VS 真實DOM)。

下面是另一個例子:這次div有一個class屬性和幾個children:

React.createElement(
  `div`,
  { className: `cn` },
  `Content 1!`,
  `Content 2!`,
);
複製程式碼

變成:

{
  type: `div`,
  props: {
    className: `cn`,
    children: [
      `Content 1!`,
      `Content 2!`
    ]
  }
}
複製程式碼

需要注意的是,那些除了typeattribute以外的屬性,原本是單獨傳進來的,轉換之後,會作為在props.children以一個陣列的形式打包存在。也就是說,無論children是作為陣列還是引數列表傳遞都沒關係 —— 在生成的虛擬DOM物件的時候,它們最後都會被打包在一起的。

進一步說,我們可以直接在元件中把children作為一項屬性傳進去,結果還是一樣的:

<div className=`cn` children={[`Content 1!`, `Content 2!`]} />
複製程式碼

在構建虛擬DOM物件完成之後,ReactDOM.render將會按下面的原則,嘗試將其轉換為瀏覽器可以識別和展示的DOM節點:

  • 如果type包含一個帶有String型別的標籤名稱(tag name)—— 建立一個標籤,附帶上props下所有attributes

  • 如果type是一個函式(function)或者類(class),呼叫它,並對結果遞迴地重複這個過程。

  • 如果props下有children屬性 —— 在父節點下,針對每個child重複以上過程。

最後,得到以下HTML(對於我們的表格示例):

<table>
  <tr>
    <td>Title</td>
  </tr>
  ...
</table>
複製程式碼

重新構建DOM(Rebuilding the DOM)

在實際應用場景,render通常在根節點呼叫一次,後續的更新會有state來控制和觸發呼叫。

請注意,標題中的“重新”!當我們想更新一個頁面而不是全部替換時,React中的魔法就開始了。我們有一些實現它的方式。我們先從最簡單的開始 —— 在同一個node節點再次執行ReactDOM.render

// Second call
ReactDOM.render(
  React.createElement(Table, { rows: rows }),
  document.getElementById(`#root`)
);
複製程式碼

這一次,上面的程式碼的表現,跟我們已經看到的有所不同。React將啟動其diff演算法,而不是從頭開始建立所有DOM節點並將其放在頁面上,來確定節點樹的哪些部分必須更新,哪些可以保持不變。

那麼,它是怎樣工作的呢?其實只有少數幾個簡單的場景,理解它們將對我們的優化幫助很大。請記住,現在我們在看的,是在React Virtual DOM裡面用來代表節點的物件

場景1:type是一個字串,type在通話中保持不變,props也沒有改變。

// before update
{ type: `div`, props: { className: `cn` } }

// after update
{ type: `div`, props: { className: `cn` } }
複製程式碼

這是最簡單的情況:DOM保持不變。

場景2:type仍然是相同的字串,props是不同的。

// before update:
{ type: `div`, props: { className: `cn` } }

// after update:
{ type: `div`, props: { className: `cnn` } }
複製程式碼

type仍然代表HTML元素,React知道如何通過標準DOM API呼叫來更改元素的屬性,而無需從DOM樹中刪除一個節點。

場景3:type已更改為不同的String或從String元件。

// before update:
{ type: `div`, props: { className: `cn` } }

// after update:
{ type: `span`, props: { className: `cn` } }
複製程式碼

React看到的type是不同的,它甚至不會嘗試更新我們的節點:old元素將和它的所有子節點一起被刪除(unmounted解除安裝)。因此,將元素替換為完全不同於DOM樹的東西代價會非常昂貴。幸運的是,這在現實世界中很少發生。

劃重點,記住React使用===(triple equals)來比較type的值,所以這兩個值需要是相同類或相同函式的相同例項。

下一個場景更加有趣,通常我們會這麼使用React。

場景4:type是一個component

// before update:
{ type: Table, props: { rows: rows } }

// after update:
{ type: Table, props: { rows: rows } }
複製程式碼

你可能會說,“咦,但沒有任何變化啊!”,但是你錯了。


如果type是對函式或類的引用(即常規的React元件),並且我們啟動了tree diff的過程,則React每次都會去檢查元件的內部邏輯,以確保render返回的值不會改變(類似對副作用的預防措施)。對樹中的每個元件進行遍歷和掃描 —— 是的,在複雜的渲染場景下,成本可能會非常昂貴!

值得注意的是,一個componentrender(只有類元件在宣告時有這個函式)跟ReactDom.render不是同一個函式。

關注子元件(children)的情況

除了上述四種常見場景之外,當一個元素有多個子元素時,我們還需要考慮React的行為。現在假設我們有這麼一個元素:

// ...
props: {
  children: [
      { type: `div` },
      { type: `span` },
      { type: `br` }
  ]
},
// ...
複製程式碼

我們想要交換一下這些children的順序:

// ...
props: {
  children: [
    { type: `span` },
    { type: `div` },
    { type: `br` }
  ]
},
// ...
複製程式碼

之後會發生什麼呢?

diffing的時候,如果React在檢查props.children下的陣列時,按順序去對比陣列內元素的話:index 0將與index 0進行比較,index 1和index 1,等等。對於每一次對比,React會使用之前提過的diff規則。在我們的例子裡,它認為div成為一個span,那麼就會運用到情景3。這樣不是很有效率的:想象一下,我們已經從1000行中刪除了第一行。React將不得不“更新”剩餘的999個子項,因為按index去對比的話,內容從第一條開始就不相同了。

幸運的是,React有一個內建的方法(built-in)來解決這個問題。如果一個元素有一個key屬性,那麼元素將按key而不是index來比較。只要key是唯一的,React就會移動元素,而不是將它們從DOM樹中移除然後再將它們放回(這個過程在React裡叫mounting和unmounting)。

// ...
props: {
  children: [ // Now React will look on key, not index
    { type: `div`, key: `div` },
    { type: `span`, key: `span` },
    { type: `br`, key: `bt` }
  ]
},
// ...
複製程式碼

當state發生了改變

到目前為止,我們只聊了下React哲學裡面的props部分,卻忽視了另外很重要的一部分state。下面是一個簡單的stateful元件:

class App extends Component {
  state = { counter: 0 }

  increment = () => this.setState({
    counter: this.state.counter + 1,
  })

  render = () => (<button onClick={this.increment}>
    {`Counter: ` + this.state.counter}
  </button>)
}
複製程式碼

state物件裡,我們有一個keycounter。點選按鈕時,這個值會增加,然後按鈕的文字也會發生相應的改變。但是,當我們這樣做時,DOM中發生了什麼?哪部分將被重新計算和更新?

呼叫this.setState會導致re-render(重新渲染),但不會影響到整個頁面,而只會影響元件本身及其children元件。父母和兄弟姐妹都不會受到影響。當我們有一個層級很深的元件鏈時,這會讓狀態更新變得非常方便,因為我們只需要重繪(redraw)它的一部分。

把問題說清楚

我們準備了一個小demo,以便你可以在看到在“野蠻生長”的React編碼方式下最常見的問題,後續我也告訴大家怎麼去解決這些問題。你可以在這裡看看它的原始碼。你還需要React Developer Tools,請確保瀏覽器安裝了它們。

我們首先要看看的是,哪些元素以及什麼時候導致Virtual DOM的更新。在瀏覽器的開發工具中,開啟React皮膚並選擇“Highlight Updates”核取方塊:

react_dev_tools.png

現在嘗試在表格中新增一行。如你所見,頁面上的每個元素周圍都會顯示一個邊框。這意味著每次新增一行時,React都在計算和比較整個虛擬DOM樹。現在嘗試點選一行內的counter按鈕。你將看到state更新後虛擬DOM如何更新 —— 只有引用了state key的元素及其children受到影響。

React DevTools會提示問題出在哪裡,但不會告訴我們有關細節的資訊:特別是所涉及的更新,是由diffing元素引起的?還是被掛載(mounting)或者被解除安裝(unmounting)了?要了解更多資訊,我們需要使用React的內建分析器(注意它不適用於生產模式)。

新增?react_perf到應用的URL,然後轉到Chrome DevTools中的“Performance”標籤。點選“錄製”(Record)並在表格上點選。新增一些row,更改一下counter,然後點選“停止”(Stop)。

react_perf_tools.png

在輸出的結果中,我們關注“User timing”這項指標。放大時間軸直到看到“React Tree Reconciliation”這個組及其子項。這些就是我們元件的名稱,它們旁邊都寫著[update]或[mount]。


我們的大部分效能問題都屬於這兩類問題之一。


無論是元件(還是從它分支的其他元件)出於某種原因都會在每次更新時re-mounted(慢),又或者我們在大型應用上執行對每個分支做diff,儘管這些元件並沒有發生改變,我們不希望這些情況的發生。

優化我們的程式碼:Mounting / Unmounting

現在,我們已經瞭解到當需要update Virtual Dom時,React是依據哪些規則去判斷要不要更新,以及也知道了我們可以通過什麼方式去追蹤這些diff場景的背後發生了什麼,我們終於準備好優化我們的程式碼了!首先,我們來看看mounts/unmounts。

如果你能夠注意到當一個元素包含的多個children,他們是由array組成的話,你可以實現十分顯著的速度優化。

我們來看看這個case:

<div>
  <Message />
  <Table />
  <Footer />
</div>
複製程式碼

在我們的Virtual DOM裡這麼表示:

// ...
props: {
  children: [
    { type: Message },
    { type: Table },
    { type: Footer }
  ]
}
// ...
複製程式碼

這裡有一個簡單的Message例子,就是一個div寫著一些簡單的文字,和以及一個巨大的Table,比方說,超過1000行。它們(MessageTable)都是頂級div的子元件,所以它們被放置在父節點的props.children下,並且它們key都不會有。React甚至不會通過控制檯警告我們要給每個child分配key,因為children正在React.createElement作為引數列表傳遞給父元素,而不是直接遍歷一個陣列。

現在我們的使用者已讀了一個通知,Message(譬如新通知按鈕)從DOM上移除。TableFooter是剩下的全部。

// ...
props: {
  children: [
    { type: Table },
    { type: Footer }
  ]
}
// ...
複製程式碼

React會怎麼處理呢?它會看作是一個array型別的children,現在少了第一項,從前第一項是Message現在是Table了,也沒有key作為索引,比較type的時候又發現它們倆不是同一個function或者class的同一個例項,於是會把整個Tableunmount,然後在mount回去,渲染它的1000+行子資料。

因此,你可以給每個component新增唯一的key(但在目特殊的case下,使用key並不是最佳選擇),或者採用更聰明的小技巧:使用短路求值(又名“最小化求值”),這是JavaScript和許多其他現代語言的特性。看:

// Using a boolean trick
<div>
  {isShown && <Message />}
  <Table />
  <Footer />
</div>
複製程式碼

雖然Message會離開螢幕,父元素divprops.children仍然會擁有三個元素,children[0]具有一個值false(一個布林值)。請記住true, false, null, undefined是虛擬DOM物件type屬性的允許值,我們最終得到了類似的結果:

// ...
props: {
  children: [
    false, //  isShown && <Message /> evaluates to false
    { type: Table },
    { type: Footer }
  ]
}
// ...
複製程式碼

因此,有沒有Message元件,我們的索引值都不會改變,Table當然仍然會跟Table比較(當type是一個函式或類的引用時,diff比較的成本還是會有的),但僅僅比較虛擬DOM的成本,通常比“刪除DOM節點”並“從0開始建立”它們要來得快。

現在我們來看看更多的東西。大家都挺喜歡用HOC的,高階元件是一個將元件作為引數,執行某些操作,最後返回另外一個不同功能的元件:

function withName(SomeComponent) {
  // Computing name, possibly expensive...
  return function(props) {
    return <SomeComponent {...props} name={name} />;
  }
}
複製程式碼

這是一種常見的模式,但你需要小心。如果我們這麼寫:

class App extends React.Component() {
  render() {
    // Creates a new instance on each render
    const ComponentWithName = withName(SomeComponent);
    return <SomeComponentWithName />;
  }
}
複製程式碼

我們在父節點的render方法內部建立一個HOC。當我們重新渲染(re-render)樹時,虛擬DOM是這樣子的:

// On first render:
{
  type: ComponentWithName,
  props: {},
}

// On second render:
{
  type: ComponentWithName, // Same name, but different instance
  props: {},
}
複製程式碼

現在,React會對ComponentWithName這個例項做diff,但由於此時同名引用了不同的例項,因此全等比較(triple equal)失敗,一個完整的re-mount會發生(整個節點換掉),而不是調整屬性值或順序。注意它也會導致狀態丟失,如此處所述。幸運的是,這很容易解決,你需要始終在render外面建立一個HOC:

// Creates a new instance just once
const ComponentWithName = withName(Component);

class App extends React.Component() {
  render() {
    return <ComponentWithName />;
  }
}
複製程式碼

優化我的程式碼:Updating

現在我們可以確保在非必要的時候,不做re-mount的事情了。然而,對位於DOM樹根部附近(層級越上面的元素)的元件所做的任何更改都會導致其所有children的diffing和調整(reconciliation)。在層級很多、結構複雜的應用裡,這些成本很昂貴,但經常是可以避免的。


如果有一種方法可以告訴React你不用來檢查這個分支了,因為我們可以肯定那個分支不會有更新,那就太棒了!


這種方式是真的有的哈,它涉及一個built-in方法叫shouldComponentUpdate,它也是元件生命週期的一部分。這個方法的呼叫時機:元件的render和元件接收到state或props的值的更新時。然後我們可以自由地將它們與我們當前的值進行比較,並決定是否更新我們的元件(返回truefalse)。如果我們返回false,React將不會重新渲染元件,也不會檢查它的所有子元件。

通常來說,比較兩個集合(set)propsstate一個簡單的淺層比較(shallow comparison)就足夠了:如果頂層的值不同,我們不必接著比較了。淺比較不是JavaScript的一個特性,但有很多小而美的庫utilities)可以讓我們用上那麼棒的功能。

現在可以像這樣編寫我們的程式碼:

class TableRow extends React.Component {

  // will return true if new props/state are different from old ones
  shouldComponentUpdate(nextProps, nextState) {
    const { props, state } = this;
    return !shallowequal(props, nextProps)
           && !shallowequal(state, nextState);
  }

  render() { /* ... */ }
}
複製程式碼

但是你甚至都不需要自己寫程式碼,因為React把這個特性內建在一個類React.PureComponent裡面。它類似於 React.Component,只是shouldComponentUpdate已經為你實施了一個淺的props/state比較。

這聽起來很“不動腦”,在宣告class繼承(extends)的時候,把Component換成PureComponent就可以享受高效率。事實上,並不是這麼“傻瓜”,看看這些例子:

<Table
    // map returns a new instance of array so shallow comparison will fail
    rows={rows.map(/* ... */)}
    // object literal is always "different" from predecessor
    style={ { color: `red` } }
    // arrow function is a new unnamed thing in the scope, so there will always be a full diffing
    onUpdate={() => { /* ... */ }}
/>
複製程式碼

上面的程式碼片段演示了三種最常見的反模式。儘量避免它們!


如果你能注意點,在render定義之外建立所有物件、陣列和函式,並確保它們在各種呼叫間,不發生更改 —— 你是安全的。


你在updated demo,所有table的rows都被“淨化”(purified)過,你可以看到PureComponent的表現了。如果你在React DevTools中開啟“Highlight Updates”,你會注意到只有表格本身和新行在插入時會觸發render,其他的行保持不變。

[譯者說:為了便於大家理解purified,譯者在下面插入了原文demo的一段程式碼]

class TableRow extends React.PureComponent {
  render() {
    return React.createElement(`tr`, { className: `row` },
      React.createElement(`td`, { className: `cell` }, this.props.title),
      React.createElement(`td`, { className: `cell` }, React.createElement(Button)),
    );
  }
};
複製程式碼

不過,如果你迫不及待地all in PureComponent,在應用裡到處都用的話 —— 控制住你自己!

shallow比較兩組propsstate不是免費的,對於大多數基本元件來說,甚至都不值得:shallowComparediffing演算法需要耗費更多的時間。

使用這個經驗法則:pure component適用於複雜的表單和表格,但它們通常會減慢簡單元素(按鈕、圖示)的效率。


感謝你的閱讀!現在你已準備好將這些見解應用到你的應用程式中。可以使用我們的小demo(用了沒有用PureComponent)的倉庫作為你的實驗的起點。此外,請繼續關注本系列的下一部分,我們計劃涵蓋Redux並優化你的資料,目標是提高整個應用的總體效能。

譯者說

正如原文末所說,Alex和Andy後續會繼續寫一個關於整體效能的系列,包括核心React和Redux等,我也會繼續跟蹤這個系列的文章,到時po到我的個人部落格和知乎專欄《集異璧》,感興趣的同學們可以關注一下哈 :)

歡迎對本文的翻譯質量、內容的各種討論。若有表述不當,歡迎斧正。

2018.05.13,晴,杭州濱江
Yuying Wu


筆者 @Yuying Wu,前端愛好者 / 鼓勵師 / 紐西蘭打工度假 / 鏟屎官。目前就職於某大型電商的B2B前端團隊。

感謝你讀到這裡。如果你和我一樣喜歡前端,喜歡搗騰獨立部落格或者前沿技術,或者有什麼職業疑問,歡迎關注我以及各種交流哈。

獨立部落格:wuyuying.com
知乎ID:@Yuying Wu
Github:Yuying Wu

相關文章