筆者在之前的一片部落格中簡單的討論了Python和Javascript的異同,其實作為一種程式語言Javascript的非同步程式設計是一個非常值得討論的有趣話題。
JavaScript 非同步程式設計簡介
回撥函式和非同步執行
所謂的非同步指的是函式的呼叫並不直接返回執行的結果,而往往是通過回撥函式非同步的執行。
我們先看看回撥函式是什麼:
var fn = function(callback) { // do something here ... callback.apply(this, para); }; var mycallback = function(parameter) { // do someting in customer callback }; // call the fn with callback as parameter fn(mycallback);
回撥函式,其實就是呼叫使用者提供的函式,該函式往往是以引數的形式提供的。回撥函式並不一定是非同步執行的。比如上述的例子中,回撥函式是被同步執行的。大部分語言都支援回撥,C++可用通過函式指標或者回撥物件,Java一般也是使用回撥物件。
在Javascript中有很多通過回撥函式來執行的非同步呼叫,例如setTimeout()或者setInterval()。
setTimeout(function(){ console.log("this will be exectued after 1 second!"); },1000);
在以上的例子中,setTimeout直接返回,匿名函式會在1000毫秒(不一定能保證是1000毫秒)後非同步觸發並執行,完成列印控制檯的操作。也就是說在非同步操作的情境下,函式直接返回,把控制權交給回撥函式,回撥函式會在以後的某一個時間片被排程執行。那麼為什麼需要非同步呢?為什麼不能直接在當前函式中完成操作呢?這就需要了解Javascript的執行緒模型了。
Javascript執行緒模型和事件驅動
Javascript最初是被設計成在瀏覽器中輔助提供HTML的互動功能。在瀏覽器中都包含一個Javascript引擎,Javscript程式就執行在這個引擎之中,並且只有一個執行緒。單執行緒能都帶來很多優點,程式設計師們可以很開心的不用去考慮諸如資源同步,死鎖等多執行緒阻塞式程式設計所需要面對的惱人的問題。但是很多人會問,既然Javascript是單執行緒的,那它又如何能夠非同步的執行呢?
這就需要了解到Javascript在瀏覽器中的事件驅動(event driven)機制。事件驅動一般通過事件迴圈(event loop)和事件佇列(event queue)來實現的。假定瀏覽器中有一個專門用於事件排程的例項(該例項可以是一個執行緒,我們可以稱之為事件分發執行緒event dispatch thread),該例項的工作就是一個不結束的迴圈,從事件佇列中取出事件,處理所有很事件關聯的回撥函式(event handler)。注意回撥函式是在Javascript的主執行緒中執行的,而非事件分發執行緒中,以保證事件處理不會發生阻塞。
Event Loop Code:
while(true) { var event = eventQueue.pop(); if(event && event.handler) { event.handler.execute(); // execute the callback in Javascript thread } else { sleep(); //sleep some time to release the CPU do other stuff } }
通過事件驅動機制,我們可以想象Javascript的程式設計模型就是響應一系列的事件,執行對應的回撥函式。很多UI框架都採用這樣的模型(例如Java Swing)。
那為什要非同步呢,同步不是很好麼?
非同步的主要目的是處理非阻塞,在和HTML互動的過程中,會需要一些IO操作(典型的就是Ajax請求,指令碼檔案載入),如果這些操作是同步的,就會阻塞其它操作,使用者的體驗就是頁面失去了響應。
綜上所述Javascript通過事件驅動機制,在單執行緒模型下,以非同步回撥函式的形式來實現非阻塞的IO操作。
Javascript非同步程式設計帶來的挑戰
Javascript的單執行緒模型有很多好處,但同時也帶來了很多挑戰。
程式碼可讀性
想象一下,如果某個操作需要經過多個非阻塞的IO操作,每一個結果都是通過回撥,程式有可能會看上去像這個樣子。
operation1(function(err, result) { operation2(function(err, result) { operation3(function(err, result) { operation4(function(err, result) { operation5(function(err, result) { // do something useful }) }) }) }) })
我們稱之為義大利麵條式(spaghetti)的程式碼。這樣的程式碼很難維護。這樣的情況更多的會發生在server side的情況下。
流程控制
非同步帶來的另一個問題是流程控制,舉個例子,我要訪問三個網站的內容,當三個網站的內容都得到後,合併處理,然後發給後臺。程式碼可以這樣寫:
var urls = ['url1','url2','url3']; var result = []; for (var i = 0, len = urls.length(); i < len; i++ ) { $.ajax({ url: urls[i], context: document.body, success: function(){ //do something on success result.push("one of the request done successfully"); if (result.length === urls.length()) { //do something when all the request is completed successfully } }}); }
上述程式碼通過檢查result的長度的方式來決定是否所有的請求都處理完成,這是一個很醜陋方法,也很不可靠。
異常和錯誤處理
通過上一個例子,我們還可以看出,為了使程式更健壯,我們還需要加入異常處理。 在非同步的方式下,異常處理分佈在不同的回撥函式中,我們無法在呼叫的時候通過try...catch的方式來處理異常, 所以很難做到有效,清楚。
更好的Javascript非同步程式設計方式
“這是最好的時代,也是最糟糕的時代”
為了解決Javascript非同步程式設計帶來的問題,很多的開發者做出了不同程度的努力,提供了很多不同的解決方案。然而面對如此眾多的方案應該如何選擇呢?我們這就來看看都有哪些可供選擇的方案吧。
Promise
Promise 物件曾經以多種形式存在於很多語言中。這個詞最先由C++工程師用在Xanadu 專案中,Xanadu 專案是Web 應用專案的先驅。隨後Promise 被用在E程式語言中,這又激發了Python 開發人員的靈感,將它實現成了Twisted 框架的Deferred 物件。
2007 年,Promise 趕上了JavaScript 大潮,那時Dojo 框架剛從Twisted框架汲取靈感,新增了一個叫做dojo.Deferred 的物件。也就在那個時候,相對成熟的Dojo 框架與初出茅廬的jQuery 框架激烈地爭奪著人氣和名望。2009 年,Kris Zyp 有感於dojo.Deferred 的影響力提出了CommonJS 之Promises/A 規範。同年,Node.js 首次亮相。
在程式設計的概念中,future,promise,和delay表示同一個概念。Promise翻譯成中文是“承諾”,也就是說給你一個東西,我保證未來能夠做到,但現在什麼都沒有。它用來表示非同步操作返回的一個物件,該物件是用來獲取未來的執行結果的一個代理,初始值不確定。許多語言都有對Promise的支援。
Promise的核心是它的then方法,我們可以使用這個方法從非同步操作中得到返回值,或者是異常。then有兩個可選引數(有的實現是三個),分別處理成功和失敗的情景。
var promise = doSomethingAync() promise.then(onFulfilled, onRejected)
非同步呼叫doSomethingAync返回一個Promise物件promise,呼叫promise的then方法來處理成功和失敗。這看上去似乎並沒有很大的改進。仍然需要回撥。但是和以前的區別在於,首先非同步操作有了返回值,雖然該值只是一個對未來的承諾;其次通過使用then,程式設計師可以有效的控制流程異常處理,決定如何使用這個來自未來的值。
對於巢狀的非同步操作,有了Promise的支援,可以寫成這樣的鏈式操作:
operation1().then(function (result1) { return operation2(result1) }).then(function (result2) { return operation3(result2); }).then(function (result3) { return operation4(result3); }).then(function (result4) { return operation5(result4) }).then(function (result5) { //And so on });Promise提供更便捷的流程控制,例如Promise.all()可以解決需要併發的執行若干個非同步操作,等所有操作完成後進行處理。
var p1 = async1(); var p2 = async2(); var p3 = async3(); Promise.all([p1,p2,p3]).then(function(){ // do something when all three asychronized operation finished });對於異常處理,
doA() .then(doB) .then(null,function(error){ // error handling here })
如果doA失敗,它的Promise會被拒絕,處理鏈上的下一個onRejected會被呼叫,在這個例子中就是匿名函式function(error){}。比起原始的回撥方式,不需要在每一步都對異常進行處理。這生了不少事。
以上只是對於Promise概念的簡單陳述,Promise擁有許多不同規範建議(A,A+,B,KISS,C,D等),名字(Future,Promise,Defer),和開源實現。大家可以參考一下的這些連結。
如果你有選擇困難綜合症,面對這麼多的開源庫不知道如何決斷,先不要急,這還只是一部分,還有一些庫沒有或者不完全採用Promise的概念
Non-Promise
下面列出了其它的一些開源的庫,也可以幫助解決Javascript中非同步程式設計所遇到的諸多問題,它們的解決方案各不相同,我這裡就不一一介紹了。大家有興趣可以去看看或者試用一下。
Non-3rd Party
其實,為了解決Javascript非同步程式設計帶來的問題,不一定非要使用Promise或者其它的開源庫,這些庫提供了很好的模式,但是你也可以通過有針對性的設計來解決。
比如,對於層層回撥的模式,可以利用訊息機制來改寫,假定你的系統中已經實現了訊息機制,你的code可以寫成這樣:
eventbus.on("init", function(){ operationA(function(err,result){ eventbus.dispatch("ACompleted"); }); }); eventbus.on("ACompleted", function(){ operationB(function(err,result){ eventbus.dispatch("BCompleted"); }); }); eventbus.on("BCompleted", function(){ operationC(function(err,result){ eventbus.dispatch("CCompleted"); }); }); eventbus.on("CCompleted", function(){ // do something when all operation completed });
這樣我們就把巢狀的非同步呼叫,改寫成了順序執行的事件處理。
更多的方式,請大家參考這篇文章,它提出瞭解決非同步的五種模式:回撥、觀察者模式(事件)、訊息、Promise和有限狀態機(FSM)。
下一代Javscript對非同步程式設計的增強
ECMAScript6
下一代的Javascript標準Harmony,也就是ECMAScript6正在醞釀中,它提出了許多新的語言特性,比如箭頭函式、類(Class)、生成器(Generator)、Promise等等。其中Generator和Promise都可以被用於對非同步呼叫的增強。
Nodejs的開發版V0.11已經可以支援ES6的一些新的特性,使用node --harmony命令來執行對ES6的支援。
co、Thunk、Koa
koa是由Express原班人馬(主要是TJ)打造,希望提供一個更精簡健壯的nodejs框架。koa依賴ES6中的Generator等新特性,所以必須執行在相應的Nodejs版本上。
利用Generator、co、Thunk,可以在Koa中有效的解決Javascript非同步呼叫的各種問題。
co是一個非同步流程簡化的工具,它利用Generator把一層層巢狀的呼叫變成同步的寫法。
var co = require('co'); var fs = require('fs'); var stat = function(path) { return function(cb){ fs.stat(path,cb); } }; var readFile = function(filename) { return function(cb){ fs.readFile(filename,cb); } }; co(function *() { var stat = yield stat('./README.md'); var content = yield readFile('./README.md'); })();
通過co可以把非同步的fs.readFile當成同步一樣呼叫,只需要把非同步函式fs.readFile用閉包的方式封裝。
利用Thunk可以進一步簡化為如下的code, 這裡Thunk的作用就是用閉包封裝非同步函式,返回一個生成函式的函式,供生成器來呼叫。
var thunkify = require('thunkify'); var co = require('co'); var fs = require('fs'); var stat = thunkify(fs.stat); var readFile = thunkify(fs.readFile); co(function *() { var stat = yield stat('./README.md'); var content = yield readFile('./README.md'); })();
利用co可以序列或者並行的執行非同步呼叫。
序列
co(function *() { var a = yield request(a); var b = yield request(b); })();並行
co(function *() { var res = yield [request(a), request(b)]; })();
總結
非同步程式設計帶來的問題在客戶端Javascript中並不明顯,但隨著伺服器端Javascript越來越廣的被使用,大量的非同步IO操作使得該問題變得明顯。許多不同的方法都可以解決這個問題,本文討論了一些方法,但並不深入。大家需要根據自己的情況選擇一個適於自己的方法。
同時,隨著ES6的定義,Javascript的語法變得越來越豐富,更多的功能帶來了很多便利,然而原本簡潔,單一目的的Javascript變得複雜,也要承擔更多的任務。Javascript何去何從,讓我們拭目以待。