淺談 Node.js 單執行緒模型

發表於2017-07-10

Node.js採用事件驅動和非同步I/O 的方式，實現了一個單執行緒、高併發的執行時環境，而單執行緒就意味著同一時間只能做一件事，那麼Node.js如何利用單執行緒來實現高併發和非同步I/O？本文將圍繞這個問題來探討Node.js的單執行緒模型：

1、高併發

一般來說，高併發的解決方案就是多執行緒模型，伺服器為每個客戶端請求分配一個執行緒，使用同步I/O，系統通過執行緒切換來彌補同步I/O呼叫的時間開銷，比如Apache就是這種策略，由於I/O一般都是耗時操作，因此這種策略很難實現高效能，但非常簡單，可以實現複雜的互動邏輯。

而事實上，大多數網站的伺服器端都不會做太多的計算，它們只是接收請求，交給其它服務（比如從資料庫讀取資料），然後等著結果返回再發給客戶端。因此，Node.js針對這一事實採用了單執行緒模型來處理，它不會為每個接入請求分配一個執行緒，而是用一個主執行緒處理所有的請求，然後對I/O操作進行非同步處理，避開了建立、銷燬執行緒以及線上程間切換所需的開銷和複雜性。

2、事件迴圈

Node.js 在主執行緒中維護了一個事件佇列，當接收到請求後，就將請求作為一個事件放入該佇列中，然後繼續接收其他請求。當主執行緒空閒時(沒有請求接入時)，就開始迴圈事件佇列，檢查佇列中是否有要處理的事件，這時要分兩種情況：如果是非I/O任務，就親自處理，並通過回撥函式返回到上層呼叫；如果是I/O任務，就從執行緒池中拿出一個執行緒來執行這個事件，並指定回撥函式，然後繼續迴圈佇列中的其他事件。當執行緒中的I/O任務完成後，就執行指定的回撥函式，並把這個完成的事件放到事件佇列的尾部，等待事件迴圈，當主執行緒再次迴圈到該事件時，就直接處理並返回給上層呼叫。這個過程就叫事件迴圈(Event Loop)，如下圖所示：

這個圖是整個Node.js的執行原理，從左到右，從上到下，Node.js被分成了四層，分別是應用層、V8引擎層、Node API層 和 LIBUV層，

應用層：即Javascript互動層，常見的就是Node.js的模組，比如 http，fs
V8引擎層：即利用V8引擎來解析Javascript語法，進而和下層API互動
NodeAPI層：為上層模組提供系統呼叫，一般是由C語言來實現，和作業系統進行互動
LIBUV層：即Event Loop，是Node.js實現非同步的核心，由LIBUV庫來實現，而LIBUV中的執行緒池是由作業系統核心接受管理的。

在Node中，無論是Linux平臺還是Windows平臺，內部都是通過執行緒池來完成IO操作的，而LIBUV就是針對不同平臺的差異性實現了統一呼叫。因此，Node.js的單執行緒僅僅是指Javascript執行在單執行緒中，而並非Node.js是單執行緒。

3、事件驅動

Node.js實現非同步的核心是事件驅動。也就是說，它把每一個任務都當成事件來處理，然後通過Event Loop 模擬了非同步的效果，為了更具體、更清晰的理解和接受這個事實，我們用程式碼來描述這個實現過程：

【1】事件佇列

首先，我們需要定義一個事件佇列，既然是佇列，那就是一個先進先出(FIFO)的資料結構，我們用JS的陣列來描述，如下：

/**
 * 定義事件佇列
 * 入隊：unshfit()
 * 出隊：pop()
 * 空佇列：length == 0
 */
eventQueue:[],

/**

* 定義事件佇列

* 入隊：unshfit()

* 出隊：pop()

* 空佇列：length == 0

eventQueue:[],

為了方便理解，我們規定：陣列的第一個元素是佇列的尾部，陣列的最後一個元素是佇列的頭部， unshfit 就是在尾部插入一個元素，pop就是從頭部彈出一個元素，這樣就實現了一個簡單的佇列。

【2】接收請求

定義一個總的入口來接收使用者請求，如下所示：

/**
 * 接收使用者請求
 * 每一個請求都會進入到該函式
 * 傳遞引數request和response
 */
processHttpRequest:function(request,response){
     
    //定義一個事件物件
    var event = createEvent({
        params:request.params, //傳遞請求引數
        result:null, //存放請求結果
        callback:function(){} //指定回撥函式
    });
 
    //在佇列的尾部新增該事件  
    eventQueue.unshift(event);
},

/**

* 接收使用者請求

* 每一個請求都會進入到該函式

* 傳遞引數request和response

processHttpRequest:function(request,response){

//定義一個事件物件

var event = createEvent({

params:request.params, //傳遞請求引數

result:null, //存放請求結果

callback:function(){} //指定回撥函式

});

//在佇列的尾部新增該事件

eventQueue.unshift(event);

這個函式很簡單，就是把使用者的請求包裝成事件，放到佇列裡，然後繼續接收其他請求。

【3】事件迴圈 ( Event Loop )

當主執行緒處於空閒時就開始迴圈事件佇列，所以，我們再定義一個事件迴圈的函式：

/**
 * 事件迴圈主體，主執行緒擇機執行
 * 迴圈遍歷事件佇列
 * 處理事件
 * 執行回撥，返回給上層
 */
eventLoop:function(){
    //如果佇列不為空，就繼續迴圈
    while(this.eventQueue.length > 0){
         
        //從佇列的頭部拿出一個事件
        var event = this.eventQueue.pop();
         
        //如果是IO任務
        if(isIOTask(event)){
            //從執行緒池裡拿出一個執行緒
            var thread = getThreadFromThreadPool();
            //交給執行緒處理
            thread.handleIOTask(event)
        }else {
            //非IO任務處理後，直接返回結果
            var result = handleEvent(event);
            //最終通過回撥函式返回給V8，再由V8返回給應用程式
            event.callback.call(null,result);
        }
    }
},

/**

* 事件迴圈主體，主執行緒擇機執行

* 迴圈遍歷事件佇列

* 處理事件

* 執行回撥，返回給上層

eventLoop:function(){

//如果佇列不為空，就繼續迴圈

while(this.eventQueue.length > 0){

//從佇列的頭部拿出一個事件

var event = this.eventQueue.pop();

//如果是IO任務

if(isIOTask(event)){

//從執行緒池裡拿出一個執行緒

var thread = getThreadFromThreadPool();

//交給執行緒處理

thread.handleIOTask(event)

}else {

//非IO任務處理後，直接返回結果

var result = handleEvent(event);

//最終通過回撥函式返回給V8，再由V8返回給應用程式

event.callback.call(null,result);

}

主執行緒不停的檢測事件佇列，對於IO任務就交給執行緒池來處理，非IO任務就自己處理並返回。

【4】執行緒池

執行緒池接到任務以後，直接處理IO操作，比如讀取資料庫：

/**
 * 處理IO任務
 * 完成後將事件新增到佇列尾部
 * 釋放執行緒
 */
handleIOTask:function(event){
    //當前執行緒
    var curThread = this;
 
    //運算元據庫
    var optDatabase = function(params,callback){
        var result = readDataFromDb(params);
        callback.call(null,result)
    };
     
    //執行IO任務
    optDatabase(event.params,function(result){
        //返回結果存入事件物件中
        event.result = result;
 
        //IO完成後，將不再是耗時任務
        event.isIOTask = false;
         
        //將該事件重新新增到佇列的尾部
        this.eventQueue.unshift(event);
         
        //釋放當前執行緒
        releaseThread(curThread)
    })
}

/**

* 處理IO任務

* 完成後將事件新增到佇列尾部

* 釋放執行緒

handleIOTask:function(event){

//當前執行緒

var curThread = this;

//運算元據庫

var optDatabase = function(params,callback){

var result = readDataFromDb(params);

callback.call(null,result)

};

//執行IO任務

optDatabase(event.params,function(result){

//返回結果存入事件物件中

event.result = result;

//IO完成後，將不再是耗時任務

event.isIOTask = false;

//將該事件重新新增到佇列的尾部

this.eventQueue.unshift(event);

//釋放當前執行緒

releaseThread(curThread)

})

}

當IO任務完成以後就執行回撥，把請求結果存入事件中，並將該事件重新放入佇列中，等待迴圈，最後釋放執行緒。當主執行緒再次迴圈到該事件時，就直接處理了。

總結以上過程我們發現，Node.js 的主執行緒就是一個單執行緒，它接收請求後並沒有直接做處理，而是放到了事件佇列中，然後去接收其他請求了，空閒時再通過Event Loop來處理這些事件，從而實現了非同步效果，當然對於IO類任務還要依賴於系統層面的執行緒池來處理。因此，我們可以簡單理解為：Node.js本身是一個多執行緒平臺，而它對JS層面的任務處理是單執行緒。

4、Node.js軟肋

至此，我們對Node.js應該有了一個簡單而又清晰的認識，但Node.js 並不是什麼都能做。

上面提到，如果是I/O任務，Nodejs就把任務交給執行緒池來非同步處理，高效簡單，因此Node.js適合處理I/O密集型任務，但不是所有的任務都是I/O密集型任務，當碰到CPU密集型任務時，就是隻用CPU計算的操作，比如要對資料加解密(node.bcrypt.js)，資料壓縮和解壓(node-tar)，這時Node.js就會親自處理，一個一個的計算，前面的任務沒有執行完，後面的任務只能乾等著，如下圖所示：

在事件佇列中，如果前面的CPU計算任務沒有完成，那麼後面的任務就會被阻塞，出現響應緩慢的情況，如果作業系統本身就是單核，那也就算了，但現在大部分伺服器都是多CPU或多核的，而Node.js只有一個EventLoop，也只佔用一個CPU/核心，當Node.js被CPU密集型任務佔用，導致其他任務被阻塞時，卻還有CPU/核心處理閒置狀態，造成資源浪費。因此Node.js並不適合CPU密集型任務。

5、Node.js適用場景

RESTful API，這是適合 Node 的理想情況，因為您可以構建它來處理數萬條連線。它仍然不需要大量邏輯；它本質上只是從某個資料庫中查詢一些值並將它們組成一個響應。由於響應是少量文字，入站請求也是少量的文字，因此流量不高，一臺機器甚至也可以處理最繁忙的公司的 API 需求。

實時程式，比如聊天服務，聊天應用程式是最能體現 Node.js 優點的例子：輕量級、高流量並且能良好的應對跨平臺裝置上執行密集型資料（雖然計算能力低）。同時，聊天也是一個非常值得學習的用例，因為它很簡單，並且涵蓋了目前為止一個典型的 Node.js 會用到的大部分解決方案。

淺談Netty的執行緒模型
2018-10-04
Netty執行緒模型
淺談linux執行緒模型和執行緒切換
2017-12-14
Linux執行緒模型
淺談多執行緒
2019-01-19
執行緒
淺談JS執行緒
2019-01-23
JS執行緒
淺談 iOS 執行緒
2015-08-08
iOS執行緒
執行緒概念淺談
2024-05-28
執行緒
Node.js 的單執行緒事件驅動模型和內建的執行緒池模型
2021-09-02
Node.js執行緒事件模型
淺談Javascript單執行緒和事件迴圈
2022-06-06
JavaScript執行緒事件
淺談 Java多執行緒
2020-09-25
Java執行緒
]淺談幾種伺服器端模型——多執行緒併發式（執行緒池）
2015-05-21
伺服器模型執行緒
淺談JS中的非同步和單執行緒
2018-08-20
JS非同步執行緒
淺談執行緒池（上）：執行緒池的作用及CLR執行緒池
2009-07-23
執行緒
淺談執行緒池（中）：獨立執行緒池的作用及IO執行緒池
2009-07-24
執行緒
Redis之單執行緒 Reactor 模型
2022-01-16
Redis執行緒React模型
Redis篇：單執行緒I/O模型
2021-12-04
Redis執行緒模型
執行緒模型
2021-09-23
執行緒模型
【雜談】JS相關的執行緒模型整理
2020-11-08
JS執行緒模型
從 JVM 記憶體模型談執行緒安全
2017-03-03
JVM記憶體模型執行緒
寶付初識單執行緒的 Node.js
2019-08-30
執行緒Node.js
淺談C++11中的多執行緒（一）
2021-07-14
C++執行緒
淺談C++11中的多執行緒（三）
2021-07-15
C++執行緒
【多執行緒與高併發】- 淺談volatile
2023-02-24
執行緒
淺談 Java執行緒狀態轉換及控制
2020-09-29
Java執行緒
Java多執行緒/併發09、淺談volatile
2017-04-28
Java執行緒
Node.js探祕（一）-初識單執行緒的Node.js
2016-01-25
Node.js執行緒
Dubbo執行緒模型
2019-01-09
執行緒模型
WPF執行緒模型
2024-03-15
執行緒模型
redis執行緒模型
2024-08-05
Redis執行緒模型
執行緒1-單執行緒
2016-08-01
執行緒
伺服器模型——從單執行緒阻塞到多執行緒非阻塞（中）
2019-02-27
伺服器模型執行緒
伺服器模型——從單執行緒阻塞到多執行緒非阻塞（下）
2019-03-04
伺服器模型執行緒
伺服器模型——從單執行緒阻塞到多執行緒非阻塞（上）
2017-12-21
伺服器模型執行緒
簡單案例淺析JS執行緒機制
2019-02-19
JS執行緒
深入理解Javascript單執行緒談Event Loop
2017-09-17
JavaScript執行緒OOP
Redis 網路架構及單執行緒模型
2016-06-08
Redis架構執行緒模型
深入淺出Java多執行緒(十二)：執行緒池
2024-03-13
Java執行緒
Redis的執行緒模型
2019-03-26
Redis執行緒模型
Dubbo的執行緒模型
2019-03-18
執行緒模型