認識node核心模組--全域性物件及Cluster

weixin_34357887發表於2017-11-03

原文地址在我的部落格,轉載請註明出處,謝謝!

node 模組是node 完成強大功能的實現者。node 的核心模組包括events、fs、buffer、stream、cluster、http、net、一些操作OS和工具模組、全域性物件等。本文將在node核心特性理解的基礎上進一步深入探討node核心模組的具體細節。本文主要探討的模組有:全域性物件global及其重要屬性、多程式cluster、events重要類EventEmitter、流Stream、檔案系統fs、網路http,還會介紹node框架express相關。

概述

本文先來介紹全域性物件global及其重要屬性、多程式cluster模組。

正文

node全域性物件global

與瀏覽器對應的window一樣,在node中global是全域性物件,在全域性作用域定義的任何變數都會儲存為global的屬性,稱為全域性變數。下面是global一些重要的屬性:

  • 模組:modulerequireexports

    這三個全域性變數組成了node 的模組定義和引入,是 commonJS 的實現。node將每個檔案視為一個模組,在執行到每個模組之前都會定義好上述三個變數,因此可以直接使用。來看它們之間的協作:

    // module1.js
    exports.fun = function(a,b) {
        return a + b;
    } //繫結在exports的屬性可以被其他模組引入使用
    
    //module2.js
    var module1 = require('./module1')
    module1.fun(3,2)     //5複製程式碼

    相關機制:

    • module 表示對這個模組的引用,因此module 實際上不是全域性的,而是每個模組本地的。module除了exports 還有其他關於模組的屬性,例如module.children
    • exports 其實是module.exports的簡寫,表示這個模組的輸出。有一點需要注意,對exports直接賦值exports = {...}並不會被輸出,因為exports事先已經被定義了,再次這樣賦值會被覆蓋,需要帶上module:module.exports = {...}
    • require 表示引入某個模組,填寫模組路徑即可,在node_modules裡面的模組填寫名字即可,js檔案可以不用寫副檔名。

    另外,由於V8引擎對ES6的不斷支援,node 中也可以直接使用ES6的一些特性、例如promise、class等,ES6的模組也被node 實驗性的引入並且是穩定的。詳情見nodejs中文網。可以在node.green檢視支援的特性

  • 非同步操作 setTimeout、setInterval、setImmediate、process.nextTick

    • setTimeout和setInterval跟瀏覽器端一樣,不同的是,node實現了setImmediate(目前瀏覽器端只有 IE實現了該方法)。它表示在 Node.js 事件迴圈的當前回合結束時要呼叫的函式,用來把一些需要長時間執行的操作放在一個回撥函式裡,在node主執行緒完成後面的其他語句後,就立刻執行這個回撥函式,引數是一個函式和用作這個函式的引數,作用跟setTimeout(fn,0)差不多,都是相當於立即在事件佇列末尾插入一個事件,但也有差別。

    • process.nextTick(fn,...args)表示在當前呼叫棧結束後,在下一個事件執行前呼叫回撥函式。node 提供這個API是為了把複雜耗時的任務放到最後去處理,以便優先執行簡單的任務。來看它們之間的比較:

      setTimeout(() => console.log("setTimeout0"),0)
      setImmediate(() => console.log("setImmediate"))
      process.nextTick(() => console.log("nextTick"))
      //輸出nextTick setTimeout0 setImmediate 或者 nextTick setImmediate setTimeout0複製程式碼

      無論process.nextTick寫在什麼地方,它總是第一個輸出。無論setTimeout和setImmediate誰先誰後,都可能出現兩種結果,其中setTimeout(fn,0)先於setImmediate多一點。這是因為它們三個產生的事件推入到了不同的watcher(觀察者)中—— setTimeout推入到了定時器觀察者,setImmediate是check觀察者,而process.nextTick()是idle觀察者 ,而node主執行緒在事件迴圈時呼叫watcher 的順序一般是 idle觀察者 > check觀察者,idle觀察者 > 定時器觀察者,check 和定時器不分先後,但定時器先於check的概率大一點。

  • node程式: process

    process 是node對程式的表示,提供了操作程式的介面,可以用process來提供程式有關資訊,控制程式 。

    process提供的介面包括

    描述程式的一些狀態(事件):exit、beforeExit、uncaughtException、Signal

    程式退出返回的狀態碼:Uncaught Fatal Exception、Signal Exits、Unused等

    程式的相關資訊:stdout、stderr、config、stdin、exitCode、pid(程式編號)等

    操作程式的方法:abort、chdir、cwd、kill(傳送訊號給程式)、exit、nextTick、getgid、setgid、uptime等

  • 其他: console、__filename__dirname

    這些都是全域性變數,可以在任何地方引用

node 子程式:child_process模組

一個程式只能利用一個CPU時間分片,為了高效利用多核CPU,node 提供了可以建立子程式(注意不是子執行緒)child_process模組,來幫助主程式高效利用多核CPU完成其他複雜的任務。之所以提供建立子程式而不是子執行緒的介面,是因為這讓我們的程式狀態單一,不用在意狀態同步、死鎖、上下文切換開銷等等多執行緒程式設計中的頭疼問題。這樣以來一個程式只有一個執行緒。雖然單執行緒也會帶來一些問題,如錯誤會引起整個應用退出等,但這都有了很好的解決方案。

建立子程式

node有三種建立子程式的介面:

  • exec / execFile: 這兩者都會建立子程式來執行,執行的結果會儲存在Buffer中。不同的是前者建立一個shell程式來執行命令,後者直接建立一個程式用來執行可執行檔案,因此前者適合用來執行shell命令然後獲取輸出,後者效率較高。這兩者因為輸出的結果儲存在Buffer中,因此只適合輸出輕量的資料。
  • spawn:適合用於程式輸入、輸出資料量比較大的情況,因為它支援以 stream 的形式輸入輸出,可以用於任何命令。spawn的引數option有一個stdio配置項,用來配置子程式與父程式之間的IO通道,還有一個detached來配置子程式是否獨立執行,可以建立常駐後臺程式。總之,給予了子程式更多的靈活性。
  • fork:fork 其實是spawn的特例,它會建立一個V8例項,只能用來執行node.js程式,並且與上面兩種方法不同的是,fork會在父子程式間建立 IPC 通道,父子程式之間可以互相收發訊息——通過監聽 message 事件和呼叫 send 方法,就可以在父子程式間進行通訊了。

父子程式通訊

首先,這三種API都返回ChildProcess例項,因此都可以通過訪問stdout屬性來得到輸出,exec/execFile 介面還可以在引數裡繫結回撥函式拿到子程式的stdout 。

const { exec, execFile, spawn, fork } = require("child_process")

// exec/execFile 介面既可以在引數裡繫結回撥函式拿到輸出流,也可以利用返回的ChildProcess例項
const exec_process = exec("node child_process.js", {}, (err, stdout, stderr) => {
    if (err) {
        console.log(err)
    } else if(stdout) {
        console.log(stdout)
    } else {
        console.log(stderr)
    }
})
exec_process.stdout.on('data',(data) => console.log(`${data}`))

// spawn 介面沒有回撥函式,只能利用返回的ChildProcess例項繫結監聽資料函式拿到子程式的輸出
const spawn_process = spawn('node',['child_process'], {})
spawn_process.stdout.on('data', (data) => console.log(`${data}`))

//fork 也可以利用返回的ChildProcess例項,注意配置項silent要設為true
const fork_process = fork('child_process.js', [], {'silent': true})
fork_process.stdout.on('data' ,(data) => console.log(`${data}`))複製程式碼

其次, fork返回的ChildProcess例項有一個額外的內建的通訊通道IPC,它允許訊息在父程式和子程式之間來回傳遞。

// child_process.js
process.on('message', (data) => {
  console.log(`message from Parent: ${data}`);
})
setTimeout(() => {
  process.send('send from child');
}, 2000)

// parent.js
const { fork } = require("child_process")
const p = fork(
  'child_process.js', // 需要執行的指令碼路徑
  [], // 傳遞的引數
  {}
)
p.on('message', data => {                      //監聽子程式訊息
  console.log(`message from child: ${data}`)
})
p.send('send from parent')                     //傳送訊息給子程式複製程式碼

叢集:Cluster 模組

cluster模組是對child_process模組的進一步封裝,專用於解決單程式NodeJS Web伺服器無法充分利用多核CPU的問題。使用該模組可以簡化多程式伺服器程式的開發,讓每個核上執行一個工作程式,並統一通過主程式監聽埠和分發請求。 ——七天學會node.js

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;
console.log(numCPUs)

if (cluster.isMaster) {
  console.log(`主程式 ${process.pid} 正在執行`);

  // 衍生工作程式。
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();      // 呼叫了 child_process.fork()方法建立工作程式
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作程式 ${worker.process.pid} 已退出`);
  });
} else {
  // 工作程式可以共享任何 TCP 連線。
  // 在本例子中,共享的是一個 HTTP 伺服器。
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end('你好世界\n');
  }).listen(8000);

  console.log(`工作程式 ${process.pid} 已啟動`);
}
console.log("WOW")

// 輸出(Mac OS)
4
主程式 55570 正在執行
WOW
4
工作程式 55571 已啟動
WOW
4
工作程式 55572 已啟動
WOW
4
工作程式 55573 已啟動
WOW
4
工作程式 55574 已啟動
WOW

//可以看到 fork 是非同步建立的,呼叫時請求建立程式並立即返回,系統建立好程式後會加入到事件佇列,執行到事件就呼叫回撥函式,這個回撥函式包括執行一遍這個檔案複製程式碼

cluster.fork()實際呼叫了child_process.fork(),因此建立了IPC通道與父程式通訊。它會建立一個程式並返回cluster.worker例項。建立的每個程式之間都是獨立的,一個程式的開啟和關閉不影響其他程式。只要有存活的程式,伺服器就可以繼續處理連線。

主程式負責監聽埠,接收新連線後會自動將連線迴圈(預設)分發給cluster.fork()建立的工作程式來幫忙處理,因此可以使用cluster模組來實現簡單的負載均衡。

注意

  • cluster.fork()返回cluster.worker例項可能會引起困惑,困惑的原因把主程式和工作程式做了master和worker的區分,這裡不用這麼區分,既然主程式也是程式,那麼也可以看作worker,呼叫cluster.fork().send(message)就可以向子程式傳送資訊,同樣監聽資訊也是cluster.fork().on('message', (data) => {...})
  • worker 和 process 都是相對的,如果當前執行程式是主程式就代表主程式,是工作程式就代表工作程式。
  • cluster代表整個叢集,也就是主程式和工作程式,隨著當前執行程式的變化,cluster的屬性也在變化。在cluster上面繫結的事件對每個程式都起作用。cluster有一些API 是隻對於主程式或只對於工作程式的,例如只能在主程式而不能在工作程式中呼叫的:fork、cluster.workers等,只能在工作程式不能在主程式呼叫的:cluster.worker等。
  • 跟上面child_process模組不一樣的是,cluster.fork()只有增加程式環境變數的引數(一般是不帶的),沒有要執行檔案路徑的引數,因此像上面程式碼那樣主程式做的事和工作程式做的事寫在同一檔案(if-else語句裡)是合理的。

相關文章