探索Javascript非同步程式設計

edithfang發表於2014-05-23

筆者在之前的一片部落格中簡單的討論了Python和Javascript的異同,其實作為一種程式語言Javascript的非同步程式設計是一個非常值得討論的有趣話題。

JavaScript 非同步程式設計簡介

回撥函式和非同步執行

所謂的非同步指的是函式的呼叫並不直接返回執行的結果,而往往是通過回撥函式非同步的執行。

我們先看看回撥函式是什麼:

var fn = function(callback) {
     // do something here
     ...
     callback.apply(this, para);
};

var mycallback = function(parameter) {
     // do someting in customer callback
};

// call the fn with callback as parameter
fn(mycallback);

回撥函式,其實就是呼叫使用者提供的函式,該函式往往是以引數的形式提供的。回撥函式並不一定是非同步執行的。比如上述的例子中,回撥函式是被同步執行的。大部分語言都支援回撥,C++可用通過函式指標或者回撥物件,Java一般也是使用回撥物件。

在Javascript中有很多通過回撥函式來執行的非同步呼叫,例如setTimeout()或者setInterval()。

setTimeout(function(){
      console.log("this will be exectued after 1 second!");
},1000);

在以上的例子中,setTimeout直接返回,匿名函式會在1000毫秒(不一定能保證是1000毫秒)後非同步觸發並執行,完成列印控制檯的操作。也就是說在非同步操作的情境下,函式直接返回,把控制權交給回撥函式,回撥函式會在以後的某一個時間片被排程執行。那麼為什麼需要非同步呢?為什麼不能直接在當前函式中完成操作呢?這就需要了解Javascript的執行緒模型了。

Javascript執行緒模型和事件驅動

Javascript最初是被設計成在瀏覽器中輔助提供HTML的互動功能。在瀏覽器中都包含一個Javascript引擎,Javscript程式就執行在這個引擎之中,並且只有一個執行緒。單執行緒能都帶來很多優點,程式設計師們可以很開心的不用去考慮諸如資源同步,死鎖等多執行緒阻塞式程式設計所需要面對的惱人的問題。但是很多人會問,既然Javascript是單執行緒的,那它又如何能夠非同步的執行呢?

這就需要了解到Javascript在瀏覽器中的事件驅動(event driven)機制。事件驅動一般通過事件迴圈(event loop)和事件佇列(event queue)來實現的。假定瀏覽器中有一個專門用於事件排程的例項(該例項可以是一個執行緒,我們可以稱之為事件分發執行緒event dispatch thread),該例項的工作就是一個不結束的迴圈,從事件佇列中取出事件,處理所有很事件關聯的回撥函式(event handler)。注意回撥函式是在Javascript的主執行緒中執行的,而非事件分發執行緒中,以保證事件處理不會發生阻塞。

Event Loop Code:

while(true) {
   var event = eventQueue.pop();
   if(event && event.handler) {
       event.handler.execute(); // execute the callback in Javascript thread
   } else {
        sleep(); //sleep some time to release the CPU do other stuff
   }
}

通過事件驅動機制,我們可以想象Javascript的程式設計模型就是響應一系列的事件,執行對應的回撥函式。很多UI框架都採用這樣的模型(例如Java Swing)。

那為什要非同步呢,同步不是很好麼?

非同步的主要目的是處理非阻塞,在和HTML互動的過程中,會需要一些IO操作(典型的就是Ajax請求,指令碼檔案載入),如果這些操作是同步的,就會阻塞其它操作,使用者的體驗就是頁面失去了響應。

綜上所述Javascript通過事件驅動機制,在單執行緒模型下,以非同步回撥函式的形式來實現非阻塞的IO操作。

Javascript非同步程式設計帶來的挑戰

Javascript的單執行緒模型有很多好處,但同時也帶來了很多挑戰。

程式碼可讀性

想象一下,如果某個操作需要經過多個非阻塞的IO操作,每一個結果都是通過回撥,程式有可能會看上去像這個樣子。

operation1(function(err, result) {
      operation2(function(err, result) {
            operation3(function(err, result) {
                  operation4(function(err, result) {
                         operation5(function(err, result) {
                               // do something useful
                         })
                  })
             })
      })
})

我們稱之為義大利麵條式(spaghetti)的程式碼。這樣的程式碼很難維護。這樣的情況更多的會發生在server side的情況下。

流程控制

非同步帶來的另一個問題是流程控制,舉個例子,我要訪問三個網站的內容,當三個網站的內容都得到後,合併處理,然後發給後臺。程式碼可以這樣寫:

var urls = ['url1','url2','url3'];
var result = [];

for (var i = 0, len = urls.length(); i < len; i++ ) {
    $.ajax({
       url: urls[i],
       context: document.body,
       success: function(){
          //do something on success
          result.push("one of the request done successfully");
          if (result.length === urls.length()) {
             //do something when all the request is completed successfully
          }
        }});
}

上述程式碼通過檢查result的長度的方式來決定是否所有的請求都處理完成,這是一個很醜陋方法,也很不可靠。

異常和錯誤處理

通過上一個例子,我們還可以看出,為了使程式更健壯,我們還需要加入異常處理。 在非同步的方式下,異常處理分佈在不同的回撥函式中,我們無法在呼叫的時候通過try...catch的方式來處理異常, 所以很難做到有效,清楚。

更好的Javascript非同步程式設計方式

“這是最好的時代,也是最糟糕的時代”

為了解決Javascript非同步程式設計帶來的問題,很多的開發者做出了不同程度的努力,提供了很多不同的解決方案。然而面對如此眾多的方案應該如何選擇呢?我們這就來看看都有哪些可供選擇的方案吧。

Promise

Promise 物件曾經以多種形式存在於很多語言中。這個詞最先由C++工程師用在Xanadu 專案中,Xanadu 專案是Web 應用專案的先驅。隨後Promise 被用在E程式語言中,這又激發了Python 開發人員的靈感,將它實現成了Twisted 框架的Deferred 物件。

2007 年,Promise 趕上了JavaScript 大潮,那時Dojo 框架剛從Twisted框架汲取靈感,新增了一個叫做dojo.Deferred 的物件。也就在那個時候,相對成熟的Dojo 框架與初出茅廬的jQuery 框架激烈地爭奪著人氣和名望。2009 年,Kris Zyp 有感於dojo.Deferred 的影響力提出了CommonJS 之Promises/A 規範。同年,Node.js 首次亮相。

在程式設計的概念中,future,promise,和delay表示同一個概念。Promise翻譯成中文是“承諾”,也就是說給你一個東西,我保證未來能夠做到,但現在什麼都沒有。它用來表示非同步操作返回的一個物件,該物件是用來獲取未來的執行結果的一個代理,初始值不確定。許多語言都有對Promise的支援。

Promise的核心是它的then方法,我們可以使用這個方法從非同步操作中得到返回值,或者是異常。then有兩個可選引數(有的實現是三個),分別處理成功和失敗的情景。

var promise = doSomethingAync()
promise.then(onFulfilled, onRejected)

非同步呼叫doSomethingAync返回一個Promise物件promise,呼叫promise的then方法來處理成功和失敗。這看上去似乎並沒有很大的改進。仍然需要回撥。但是和以前的區別在於,首先非同步操作有了返回值,雖然該值只是一個對未來的承諾;其次通過使用then,程式設計師可以有效的控制流程異常處理,決定如何使用這個來自未來的值。

對於巢狀的非同步操作,有了Promise的支援,可以寫成這樣的鏈式操作:

operation1().then(function (result1) {
       return operation2(result1)
}).then(function (result2) {
     return operation3(result2);
}).then(function (result3) {
     return operation4(result3);
}).then(function (result4) {
     return operation5(result4)
}).then(function (result5) {
     //And so on
});
Promise提供更便捷的流程控制,例如Promise.all()可以解決需要併發的執行若干個非同步操作,等所有操作完成後進行處理。

var p1 = async1();
var p2 = async2();
var p3 = async3();
Promise.all([p1,p2,p3]).then(function(){
      // do something when all three asychronized operation finished
});
對於異常處理,

doA()
    .then(doB)
    .then(null,function(error){
          // error handling here
    })

如果doA失敗,它的Promise會被拒絕,處理鏈上的下一個onRejected會被呼叫,在這個例子中就是匿名函式function(error){}。比起原始的回撥方式,不需要在每一步都對異常進行處理。這生了不少事。

以上只是對於Promise概念的簡單陳述,Promise擁有許多不同規範建議(A,A+,B,KISS,C,D等),名字(Future,Promise,Defer),和開源實現。大家可以參考一下的這些連結。

如果你有選擇困難綜合症,面對這麼多的開源庫不知道如何決斷,先不要急,這還只是一部分,還有一些庫沒有或者不完全採用Promise的概念

Non-Promise

下面列出了其它的一些開源的庫,也可以幫助解決Javascript中非同步程式設計所遇到的諸多問題,它們的解決方案各不相同,我這裡就不一一介紹了。大家有興趣可以去看看或者試用一下。

Non-3rd Party

其實,為了解決Javascript非同步程式設計帶來的問題,不一定非要使用Promise或者其它的開源庫,這些庫提供了很好的模式,但是你也可以通過有針對性的設計來解決。

比如,對於層層回撥的模式,可以利用訊息機制來改寫,假定你的系統中已經實現了訊息機制,你的code可以寫成這樣:

eventbus.on("init", function(){
       operationA(function(err,result){
             eventbus.dispatch("ACompleted");
       });
});

eventbus.on("ACompleted", function(){
      operationB(function(err,result){
            eventbus.dispatch("BCompleted");
      });
});

eventbus.on("BCompleted", function(){
       operationC(function(err,result){
             eventbus.dispatch("CCompleted");
       });
});

eventbus.on("CCompleted", function(){
       // do something when all operation completed
});

這樣我們就把巢狀的非同步呼叫,改寫成了順序執行的事件處理。

更多的方式,請大家參考這篇文章,它提出瞭解決非同步的五種模式:回撥、觀察者模式(事件)、訊息、Promise和有限狀態機(FSM)。

下一代Javscript對非同步程式設計的增強

ECMAScript6

下一代的Javascript標準Harmony,也就是ECMAScript6正在醞釀中,它提出了許多新的語言特性,比如箭頭函式、類(Class)、生成器(Generator)、Promise等等。其中Generator和Promise都可以被用於對非同步呼叫的增強。

Nodejs的開發版V0.11已經可以支援ES6的一些新的特性,使用node --harmony命令來執行對ES6的支援。

co、Thunk、Koa

koa是由Express原班人馬(主要是TJ)打造,希望提供一個更精簡健壯的nodejs框架。koa依賴ES6中的Generator等新特性,所以必須執行在相應的Nodejs版本上。

利用Generator、coThunk,可以在Koa中有效的解決Javascript非同步呼叫的各種問題。

co是一個非同步流程簡化的工具,它利用Generator把一層層巢狀的呼叫變成同步的寫法。

var co = require('co');
var fs = require('fs');

var stat = function(path) {
   return function(cb){
      fs.stat(path,cb);
   }
};

var readFile = function(filename) {
   return function(cb){
      fs.readFile(filename,cb);
   }
};

co(function *() {
   var stat = yield stat('./README.md');
   var content = yield readFile('./README.md');
})();

通過co可以把非同步的fs.readFile當成同步一樣呼叫,只需要把非同步函式fs.readFile用閉包的方式封裝。

利用Thunk可以進一步簡化為如下的code, 這裡Thunk的作用就是用閉包封裝非同步函式,返回一個生成函式的函式,供生成器來呼叫。

var thunkify = require('thunkify');
var co = require('co');
var fs = require('fs');

var stat = thunkify(fs.stat);
var readFile = thunkify(fs.readFile);

co(function *() {
   var stat = yield stat('./README.md');
   var content = yield readFile('./README.md');
})();

利用co可以序列或者並行的執行非同步呼叫。

序列

co(function *() {
   var a = yield request(a);
   var b = yield request(b);
})();
並行

co(function *() {
  var res = yield [request(a), request(b)];
})();

總結

非同步程式設計帶來的問題在客戶端Javascript中並不明顯,但隨著伺服器端Javascript越來越廣的被使用,大量的非同步IO操作使得該問題變得明顯。許多不同的方法都可以解決這個問題,本文討論了一些方法,但並不深入。大家需要根據自己的情況選擇一個適於自己的方法。

同時,隨著ES6的定義,Javascript的語法變得越來越豐富,更多的功能帶來了很多便利,然而原本簡潔,單一目的的Javascript變得複雜,也要承擔更多的任務。Javascript何去何從,讓我們拭目以待。

評論(1)

相關文章