微任務、巨集任務與Event-Loop

Jiasm發表於2018-08-15

首先,JavaScript是一個單執行緒的指令碼語言。

所以就是說在一行程式碼執行的過程中,必然不會存在同時執行的另一行程式碼,就像使用alert()以後進行瘋狂console.log,如果沒有關閉彈框,控制檯是不會顯示出一條log資訊的。

亦或者有些程式碼執行了大量計算,比方說在前端暴力破解密碼之類的鬼操作,這就會導致後續程式碼一直在等待,頁面處於假死狀態,因為前邊的程式碼並沒有執行完。

所以如果全部程式碼都是同步執行的,這會引發很嚴重的問題,比方說我們要從遠端獲取一些資料,難道要一直迴圈程式碼去判斷是否拿到了返回結果麼?就像去飯店點餐,肯定不能說點完了以後就去後廚催著人炒菜的,會被揍的。

於是就有了非同步事件的概念,註冊一個回撥函式,比如說發一個網路請求,我們告訴主程式等到接收到資料後通知我,然後我們就可以去做其他的事情了。

然後在非同步完成後,會通知到我們,但是此時可能程式正在做其他的事情,所以即使非同步完成了也需要在一旁等待,等到程式空閒下來才有時間去看哪些非同步已經完成了,可以去執行。

比如說打了個車,如果司機先到了,但是你手頭還有點兒事情要處理,這時司機是不可能自己先開著車走的,一定要等到你處理完事情上了車才能走。

微任務、巨集任務與Event-Loop

微任務與巨集任務的區別

這個就像去銀行辦業務一樣,先要取號進行排號。
一般上邊都會印著類似:“您的號碼為XX,前邊還有XX人。”之類的字樣。

因為櫃員同時職能處理一個來辦理業務的客戶,這時每一個來辦理業務的人就可以認為是銀行櫃員的一個巨集任務來存在的,當櫃員處理完當前客戶的問題以後,選擇接待下一位,廣播報號,也就是下一個巨集任務的開始。
所以多個巨集任務合在一起就可以認為說有一個任務佇列在這,裡邊是當前銀行中所有排號的客戶。
任務佇列中的都是已經完成的非同步操作,而不是說註冊一個非同步任務就會被放在這個任務佇列中,就像在銀行中排號,如果叫到你的時候你不在,那麼你當前的號牌就作廢了,櫃員會選擇直接跳過進行下一個客戶的業務處理,等你回來以後還需要重新取號

而且一個巨集任務在執行的過程中,是可以新增一些微任務的,就像在櫃檯辦理業務,你前邊的一位老大爺可能在存款,在存款這個業務辦理完以後,櫃員會問老大爺還有沒有其他需要辦理的業務,這時老大爺想了一下:“最近P2P爆雷有點兒多,是不是要選擇穩一些的理財呢”,然後告訴櫃員說,要辦一些理財的業務,這時候櫃員肯定不能告訴老大爺說:“您再上後邊取個號去,重新排隊”。
所以本來快輪到你來辦理業務,會因為老大爺臨時新增的“理財業務”而往後推。
也許老大爺在辦完理財以後還想 再辦一個信用卡?或者 再買點兒紀念幣
無論是什麼需求,只要是櫃員能夠幫她辦理的,都會在處理你的業務之前來做這些事情,這些都可以認為是微任務。

這就說明:你大爺永遠是你大爺
在當前的微任務沒有執行完成時,是不會執行下一個巨集任務的。

所以就有了那個經常在面試題、各種部落格中的程式碼片段:

setTimeout(_ => console.log(4))

new Promise(resolve => {
  resolve()
  console.log(1)
}).then(_ => {
  console.log(3)
})

console.log(2)
複製程式碼

setTimeout就是作為巨集任務來存在的,而Promise.then則是具有代表性的微任務,上述程式碼的執行順序就是按照序號來輸出的。

所有會進入的非同步都是指的事件回撥中的那部分程式碼
也就是說new Promise在例項化的過程中所執行的程式碼都是同步進行的,而then中註冊的回撥才是非同步執行的。
在同步程式碼執行完成後才回去檢查是否有非同步任務完成,並執行對應的回撥,而微任務又會在巨集任務之前執行。
所以就得到了上述的輸出結論1、2、3、4

+部分表示同步執行的程式碼

+setTimeout(_ => {
-  console.log(4)
+})

+new Promise(resolve => {
+  resolve()
+  console.log(1)
+}).then(_ => {
-  console.log(3)
+})

+console.log(2)
複製程式碼

本來setTimeout已經先設定了定時器(相當於取號),然後在當前程式中又新增了一些Promise的處理(臨時新增業務)。

所以進階的,即便我們繼續在Promise中例項化Promise,其輸出依然會早於setTimeout的巨集任務:

setTimeout(_ => console.log(4))

new Promise(resolve => {
  resolve()
  console.log(1)
}).then(_ => {
  console.log(3)
  Promise.resolve().then(_ => {
    console.log('before timeout')
  }).then(_ => {
    Promise.resolve().then(_ => {
      console.log('also before timeout')
    })
  })
})

console.log(2)
複製程式碼

當然了,實際情況下很少會有簡單的這麼呼叫Promise的,一般都會在裡邊有其他的非同步操作,比如fetchfs.readFile之類的操作。
而這些其實就相當於註冊了一個巨集任務,而非是微任務。

P.S. 在Promise/A+的規範中,Promise的實現可以是微任務,也可以是巨集任務,但是普遍的共識表示(至少Chrome是這麼做的),Promise應該是屬於微任務陣營的

所以,明白哪些操作是巨集任務、哪些是微任務就變得很關鍵,這是目前業界比較流行的說法:

巨集任務

# 瀏覽器 Node
I/O
setTimeout
setInterval
setImmediate
requestAnimationFrame

有些地方會列出來UI Rendering,說這個也是巨集任務,可是在讀了HTML規範文件以後,發現這很顯然是和微任務平行的一個操作步驟
requestAnimationFrame姑且也算是巨集任務吧,requestAnimationFrameMDN的定義為,下次頁面重繪前所執行的操作,而重繪也是作為巨集任務的一個步驟來存在的,且該步驟晚於微任務的執行

微任務

# 瀏覽器 Node
process.nextTick
MutationObserver
Promise.then catch finally

Event-Loop是個啥

上邊一直在討論 巨集任務、微任務,各種任務的執行。
但是回到現實,JavaScript是一個單程式的語言,同一時間不能處理多個任務,所以何時執行巨集任務,何時執行微任務?我們需要有這樣的一個判斷邏輯存在。

每辦理完一個業務,櫃員就會問當前的客戶,是否還有其他需要辦理的業務。(檢查還有沒有微任務需要處理)
而客戶明確告知說沒有事情以後,櫃員就去檢視後邊還有沒有等著辦理業務的人。(結束本次巨集任務、檢查還有沒有巨集任務需要處理)
這個檢查的過程是持續進行的,每完成一個任務都會進行一次,而這樣的操作就被稱為Event Loop(這是個非常簡易的描述了,實際上會複雜很多)

而且就如同上邊所說的,一個櫃員同一時間只能處理一件事情,即便這些事情是一個客戶所提出的,所以可以認為微任務也存在一個佇列,大致是這樣的一個邏輯:

const macroTaskList = [
  ['task1'],
  ['task2', 'task3'],
  ['task4'],
]

for (let macroIndex = 0; macroIndex < macroTaskList.length; macroIndex++) {
  const microTaskList = macroTaskList[macroIndex]
  
  for (let microIndex = 0; microIndex < microTaskList.length; microIndex++) {
    const microTask = microTaskList[microIndex]

    // 新增一個微任務
    if (microIndex === 1) microTaskList.push('special micro task')
    
    // 執行任務
    console.log(microTask)
  }

  // 新增一個巨集任務
  if (macroIndex === 2) macroTaskList.push(['special macro task'])
}

// > task1
// > task2
// > task3
// > special micro task
// > task4
// > special macro task
複製程式碼

之所以使用兩個for迴圈來表示,是因為在迴圈內部可以很方便的進行push之類的操作(新增一些任務),從而使迭代的次數動態的增加。

以及還要明確的是,Event Loop只是負責告訴你該執行那些任務,或者說哪些回撥被觸發了,真正的邏輯還是在程式中執行的。

在瀏覽器中的表現

在上邊簡單的說明了兩種任務的差別,以及Event Loop的作用,那麼在真實的瀏覽器中是什麼表現呢?
首先要明確的一點是,巨集任務必然是在微任務之後才執行的(因為微任務實際上是巨集任務的其中一個步驟)

I/O這一項感覺有點兒籠統,有太多的東西都可以稱之為I/O,點選一次button,上傳一個檔案,與程式產生互動的這些都可以稱之為I/O

假設有這樣的一些DOM結構:

<style>
  #outer {
    padding: 20px;
    background: #616161;
  }

  #inner {
    width: 100px;
    height: 100px;
    background: #757575;
  }
</style>
<div id="outer">
  <div id="inner"></div>
</div>
複製程式碼
const $inner = document.querySelector('#inner')
const $outer = document.querySelector('#outer')

function handler () {
  console.log('click') // 直接輸出

  Promise.resolve().then(_ => console.log('promise')) // 註冊微任務

  setTimeout(_ => console.log('timeout')) // 註冊巨集任務

  requestAnimationFrame(_ => console.log('animationFrame')) // 註冊巨集任務

  $outer.setAttribute('data-random', Math.random()) // DOM屬性修改,觸發微任務
}

new MutationObserver(_ => {
  console.log('observer')
}).observe($outer, {
  attributes: true
})

$inner.addEventListener('click', handler)
$outer.addEventListener('click', handler)
複製程式碼

如果點選#inner,其執行順序一定是:click -> promise -> observer -> click -> promise -> observer -> animationFrame -> animationFrame -> timeout -> timeout

因為一次I/O建立了一個巨集任務,也就是說在這次任務中會去觸發handler
按照程式碼中的註釋,在同步的程式碼已經執行完以後,這時就會去檢視是否有微任務可以執行,然後發現了PromiseMutationObserver兩個微任務,遂執行之。
因為click事件會冒泡,所以對應的這次I/O會觸發兩次handler函式(一次在inner、一次在outer),所以會優先執行冒泡的事件(早於其他的巨集任務),也就是說會重複上述的邏輯。
在執行完同步程式碼與微任務以後,這時繼續向後查詢有木有巨集任務。
需要注意的一點是,因為我們觸發了setAttribute,實際上修改了DOM的屬性,這會導致頁面的重繪,而這個set的操作是同步執行的,也就是說requestAnimationFrame的回撥會早於setTimeout所執行。

一些小驚喜

使用上述的示例程式碼,如果將手動點選DOM元素的觸發方式變為$inner.click(),那麼會得到不一樣的結果。
Chrome下的輸出順序大致是這樣的:
click -> click -> promise -> observer -> promise -> animationFrame -> animationFrame -> timeout -> timeout

與我們手動觸發click的執行順序不一樣的原因是這樣的,因為並不是使用者通過點選元素實現的觸發事件,而是類似dispatchEvent這樣的方式,我個人覺得並不能算是一個有效的I/O,在執行了一次handler回撥註冊了微任務、註冊了巨集任務以後,實際上外邊的$inner.click()並沒有執行完。
所以在微任務執行之前,還要繼續冒泡執行下一次事件,也就是說觸發了第二次的handler
所以輸出了第二次click,等到這兩次handler都執行完畢後才會去檢查有沒有微任務、有沒有巨集任務。

兩點需要注意的:

  1. .click()的這種觸發事件的方式個人認為是類似dispatchEvent,可以理解為同步執行的程式碼
document.body.addEventListener('click', _ => console.log('click'))

document.body.click()
document.body.dispatchEvent(new Event('click'))
console.log('done')

// > click
// > click
// > done
複製程式碼
  1. MutationObserver的監聽不會說同時觸發多次,多次修改只會有一次回撥被觸發。
new MutationObserver(_ => {
  console.log('observer')
  // 如果在這輸出DOM的data-random屬性,必然是最後一次的值,不解釋了
}).observe(document.body, {
  attributes: true
})

document.body.setAttribute('data-random', Math.random())
document.body.setAttribute('data-random', Math.random())
document.body.setAttribute('data-random', Math.random())

// 只會輸出一次 ovserver
複製程式碼

這就像去飯店點餐,服務員喊了三次,XX號的牛肉麵,不代表她會給你三碗牛肉麵。
上述觀點參閱自Tasks, microtasks, queues and schedules,文中有動畫版的講解

在Node中的表現

Node也是單執行緒,但是在處理Event Loop上與瀏覽器稍微有些不同,這裡是Node官方文件的地址。

就單從API層面上來理解,Node新增了兩個方法可以用來使用:微任務的process.nextTick以及巨集任務的setImmediate

setImmediate與setTimeout的區別

在官方文件中的定義,setImmediate為一次Event Loop執行完畢後呼叫。
setTimeout則是通過計算一個延遲時間後進行執行。

但是同時還提到了如果在主程式中直接執行這兩個操作,很難保證哪個會先觸發。
因為如果主程式中先註冊了兩個任務,然後執行的程式碼耗時超過XXs,而這時定時器已經處於可執行回撥的狀態了。
所以會先執行定時器,而執行完定時器以後才是結束了一次Event Loop,這時才會執行setImmediate

setTimeout(_ => console.log('setTimeout'))
setImmediate(_ => console.log('setImmediate'))
複製程式碼

有興趣的可以自己試驗一下,執行多次真的會得到不同的結果。

微任務、巨集任務與Event-Loop

但是如果後續新增一些程式碼以後,就可以保證setTimeout一定會在setImmediate之前觸發了:

setTimeout(_ => console.log('setTimeout'))
setImmediate(_ => console.log('setImmediate'))

let countdown = 1e9

while(countdown--) { } // 我們確保這個迴圈的執行速度會超過定時器的倒數計時,導致這輪迴圈沒有結束時,setTimeout已經可以執行回撥了,所以會先執行`setTimeout`再結束這一輪迴圈,也就是說開始執行`setImmediate`
複製程式碼

如果在另一個巨集任務中,必然是setImmediate先執行:

require('fs').readFile(__dirname, _ => {
  setTimeout(_ => console.log('timeout'))
  setImmediate(_ => console.log('immediate'))
})

// 如果使用一個設定了延遲的setTimeout也可以實現相同的效果
複製程式碼

process.nextTick

就像上邊說的,這個可以認為是一個類似於PromiseMutationObserver的微任務實現,在程式碼執行的過程中可以隨時插入nextTick,並且會保證在下一個巨集任務開始之前所執行。

在使用方面的一個最常見的例子就是一些事件繫結類的操作:

class Lib extends require('events').EventEmitter {
  constructor () {
    super()

    this.emit('init')
  }
}

const lib = new Lib()

lib.on('init', _ => {
  // 這裡將永遠不會執行
  console.log('init!')
})
複製程式碼

因為上述的程式碼在例項化Lib物件時是同步執行的,在例項化完成以後就立馬傳送了init事件。
而這時在外層的主程式還沒有開始執行到lib.on('init')監聽事件的這一步。
所以會導致傳送事件時沒有回撥,回撥註冊後事件不會再次傳送。

我們可以很輕鬆的使用process.nextTick來解決這個問題:

class Lib extends require('events').EventEmitter {
  constructor () {
    super()

    process.nextTick(_ => {
      this.emit('init')
    })

    // 同理使用其他的微任務
    // 比如Promise.resolve().then(_ => this.emit('init'))
    // 也可以實現相同的效果
  }
}
複製程式碼

這樣會在主程式的程式碼執行完畢後,程式空閒時觸發Event Loop流程查詢有沒有微任務,然後再傳送init事件。

關於有些文章中提到的,迴圈呼叫process.nextTick會導致報警,後續的程式碼永遠不會被執行,這是對的,參見上邊使用的雙重迴圈實現的loop即可,相當於在每次for迴圈執行中都對陣列進行了push操作,這樣迴圈永遠也不會結束

多提一嘴async/await函式

因為,async/await本質上還是基於Promise的一些封裝,而Promise是屬於微任務的一種。所以在使用await關鍵字與Promise.then效果類似:

setTimeout(_ => console.log(4))

async function main() {
  console.log(1)
  await Promise.resolve()
  console.log(3)
}

main()

console.log(2)
複製程式碼

async函式在await之前的程式碼都是同步執行的,可以理解為await之前的程式碼屬於new Promise時傳入的程式碼,await之後的所有程式碼都是在Promise.then中的回撥

小節

JavaScript的程式碼執行機制在網上有好多文章都寫,本人道行太淺,只能簡單的說一下自己對其的理解。
並沒有去生摳文件,一步一步的列出來,像什麼檢視當前棧、執行選中的任務佇列,各種balabala。
感覺對實際寫程式碼沒有太大幫助,不如簡單的入個門,掃個盲,大致瞭解一下這是個什麼東西就好了。

推薦幾篇參閱的文章:

One more things

Blued前端/Node團隊招人。。初中高都有HC
座標帝都朝陽雙井,有興趣的請聯絡我:
wechat: github_jiasm
mail: jiashunming@blued.com

歡迎砸簡歷

相關文章