JavaScript世界的一等公民 - 函式

lingxyd_0發表於2012-11-27


JavaScript世界的一等公民 - 函式


轉帖於:http://software.intel.com/zh-cn/articles/javascript-first-class-citizen-function/?cid=sw:prccsdn229032


簡介

在很多傳統語言(C/C++/Java/C#等)中,函式都是作為一個二等公民存在,你只能用語言的關鍵字宣告一個函式然後呼叫它,如果需要把函式作為引數傳給另一個函式,或是賦值給一個本地變數,又或是作為返回值,就需要通過函式指標(function pointer)、代理(delegate)等特殊的方式周折一番。
而在JavaScript世界中函式卻是一等公民,它不僅擁有一切傳統函式的使用方式(宣告和呼叫),而且可以做到像簡單值一樣賦值、傳參、返回,這樣的函式也稱之為第一級函式(First-class Function)。不僅如此,JavaScript中的函式還充當了類的建構函式的作用,同時又是一個Function類的例項(instance)。這樣的多重身份讓JavaScript的函式變得非常重要。

一、JavaScript函式入門級

JavaScript函式像一般語言一樣也是遵循先宣告後使用的原則,函式名只能包含字母、數字、下劃線或$,且不能以數字開頭。函式常見的宣告方式有以下兩種:
1// 直接宣告函式myfunc
2function myfunc(/* arguments */) {
3}
4 
5// 把匿名函式賦值給本地變數myfunc
6var myfunc = function(/* arguments */) {
7}
注意,上面兩種函式宣告方式存在細微的差別:第一種方式在宣告時就是一個命名的函式,無論是宣告在呼叫之前呼叫之後,甚至是不會執行到的位置(例如return語句之後或是永遠不會為真的分支裡),都在整個作用域可訪問;第二種方式是通過把匿名函式賦值給變數的方式,嚴格意義上說這不是一個函式的宣告(function declaration)而是一個函式表示式(function expression),在賦值之前這個函式不能被任何程式碼訪問到,也就是說這個賦值必須在呼叫之前完成,否則呼叫時會出現錯誤:"TypeError: undefined is not a function"。例如:
1myfunc1(); // 能夠正常呼叫,因為myfunc1採用直接宣告的方式
2 
3function myfunc1() {
4}
5 
6myfunc2(); // 出錯 TypeError: undefined is not a function
7 
8var myfunc2 = function() {
9};
函式的基本呼叫方式與傳統語言相同用一對括號呼叫: myfunc()。JavaScript的函式也支援直接或間接的遞迴(recursive)呼叫,例如經典的斐波那契函式用JavaScript可以這樣實現:
1function fib(n) {
2  if (n == 1 || n == 2) {
3    return 1;
4  } else {
5    return fib(n - 2) + fib(n - 1);
6  }
7}
在JavaScript的函式可以處理變長引數,在函式內部都擁有一個名為arguments的區域性變數,它是一個類陣列(array-liked)的物件,裡面包含了所有呼叫時傳入的引數,有length屬性表示引數的個數。例如:
1function test() {
2  alert(arguments.length);
3}
4 
5test(1); // 1
6test(1, 'a'); // 2
7test(true, [], {}); // 3
利用arguments可以實現類似C語言printf的功能,也可以用來實現方法的多型。

二、JavaScript函式進階

2.1 匿名函式和巢狀函式

在JavaScript可以宣告一個沒有名稱的函式,稱為匿名函式(Anonymouse Function)。同時JavaScript還允許在函式內部宣告函式,稱為巢狀函式(Nested Function),巢狀函式的作用域為整個父函式。
在前面函式宣告的部分就看到了匿名函式和巢狀函式的一種用法,由於匿名函式沒有名稱,不會引入新的變數汙染上下文環境,而且會帶來新的變數作用域,因此匿名函式常被用來防止全域性環境汙染。

JavaScript執行時中有一個特殊的全域性環境(global object),這個物件上面存放全域性的函式和變數,實際開發中經常會使用若干第三方的庫或多個js檔案,若不小心在全域性物件引入重複的變數或函式宣告,則會造成程式碼執行混亂。例如先後引入兩個js檔案,分別定義了自己的函式log作為內部使用,則第二引入的函式會覆蓋第一個的定義且不會丟擲任何錯誤,在後續的執行中呼叫log函式可能會造成錯誤。這時候使用一個匿名函式將整個js內的邏輯包裝起來,就可以避免這種錯誤,這種方法已經被絕大多數開源js庫使用。
1(function() { // 匿名函式
2 
3function log(msg) {
4    console.log(msg);
5}
6 
7// 其他程式碼
8 
9}()); // 立即執行
以上程式碼就是一個簡單的示例,log函式的作用域被限制在這個匿名函式之內,而匿名函式則因為被外面一對小括號()包括起來,形成一個函式表示式,表示式的值是一個函式,緊接著一對小括號表示立即執行這個函式,讓原有的程式碼正常執行一次。不過,這種方式宣告的函式、通過var宣告的變數等等都是內部的,不能被任何匿名函式以外的程式碼訪問到。如果你需要對外暴露一些函式作為介面的話有如下幾種方法:
01var mylib = (function(global) {
02 
03function log(msg) {
04  console.log(msg);
05}
06 
07log1 = log// 法一:利用沒有var的變數宣告的預設行為,在log1成為全域性變數(不推薦)
08 
09global.log2 = log// 法二:直接在全域性物件上新增log2屬性,賦值為log函式(推薦)
10 
11return // 法三:通過匿名函式返回值得到一系列介面函式集合物件,賦值給全域性變數mylib(推薦)
12   log: log
13};
14 
15}(window));
2.2 高階函式(High-order Function)
如果函式作為引數或返回值使用時,就稱為高階函式,JavaScript中的函式都可以作為高階函式來使用,這也是第一類函式的特徵。下面我們就分別分析一下這兩種使用方法。
01function negative(n) {
02  return -n; // 取n的相反值
03}
04 
05function square(n) {
06  return n*n; // n的平方
07}
08 
09function process(nums, callback) {
10  var result = [];
11 
12  for(var i = 0, length = nums.length; i < length; i++) {
13    result[i] = callback(nums[i]); // 對陣列nums中的所有元素傳遞給callback進行處理,將返回值作為結果儲存
14  }
15 
16  return result;
17}
18 
19var nums = [-3, -2, -1, 0, 1, 2, 3, 4];
20var n_neg = process(nums, negative);
21// n_neg = [3, 2, 1, 0, -1, -2, -3, -4];
22var n_square = process(nums, square);
23// n_square = [9, 4, 1, 0, 1, 4, 9, 16];
以上程式碼展示了把函式作為引數傳入另一個函式process呼叫的示例,在process函式的實現中,把callback作為一個黑盒子看待,負責把引數傳給它,然後獲取返回值,在呼叫之前並不清楚callback的具體實現。只有當執行到20行和22行時,callback才被分別代表negative或square,分別對每個元素進行取相反值或平方值的操作。
01function generator() {
02  var i = 0;
03  return function() {
04    return i++;
05  };
06}
07 
08var gen1 = generator(); // 得到一個自然數生成器
09var gen2 = generator(); // 得到另一個自然數生成器
10var r1 = gen1(); // r1 = 0
11var r2 = gen1(); // r2 = 1
12var r3 = gen2(); // r3 = 0
13var r4 = gen2(); // r4 = 1
上面的程式碼展示了把函式作為返回值的示例,generator是一個自然數生成器函式,返回值是一個自然數生成函式。每次呼叫generator時都會把一個匿名函式作為結果返回,這個匿名函式在被實際呼叫時依次返回每個自然數。在generator裡的變數i在每次呼叫這個匿名函式時都會自增1,這其實就是一個閉包。下面我們來介紹一下閉包.
2.3 閉包(Closure)
閉包(Closure)並不是一個新鮮的概念,很多函式式語言中都使用了閉包。在JavaScript中,當你在內嵌函式中使用外部函式作用域內的變數時,就是使用了閉包。用一個常用的類比來解釋閉包和類(Class)的關係:類是帶函式的資料,閉包是帶資料的函式。
閉包中使用的變數有一個特性,就是它們不在父函式返回時釋放,而是隨著閉包生命週期的結束而結束。比如像上一節中generator的例子,gen1和gen2分別使用了相互獨立的變數i(在gen1的i自增1的時候,gen2的i並不受影響,反之亦然),只要gen1或gen2這兩個變數沒有被JavaScript引擎垃圾回收,他們各自的變數i就不會被釋放。在JavaScript程式設計中,不知不覺就會使用到閉包,閉包的這個特性在帶來易用的同時,也容易帶來類似記憶體洩露的問題。例如:
1var elem = document.getElementById('test');
2elem.addEventListener('click', function() {
3  alert('You clicked ' + elem.tagName);
4});
這段程式碼的作用是點選一個結點時顯示它的標籤名稱,它把一個匿名函式註冊為一個DOM結點的click事件處理函式,函式內引用了一個DOM物件elem,就形成了閉包。這就會產生一個迴圈引用,即:DOM->閉包->DOM->閉包...DOM物件在閉包釋放之前不會被釋放;而閉包作為DOM物件的事件處理函式存在,所以在DOM物件釋放前閉包不會釋放,即使DOM物件在DOM tree中刪除,由於這個迴圈引用的存在,DOM物件和閉包都不會被釋放。可以用下面的方法可以避免這種記憶體洩露:
1var elem = document.getElementById('test');
2elem.addEventListener('click', function() {
3  alert('You clicked ' + this.tagName); // 不再直接引用elem變數
4});
上面這段程式碼中用this代替elem(在DOM事件處理函式中this指標指向DOM元素本身),讓JS執行時不再認為這個函式中使用了父類的變數,因此不再形成閉包。
閉包還會帶來很多類似的記憶體洩露問題,只有在寫程式碼的時候著重注意一下閉包,儘量避免此類的問題產生。
2.4 類建構函式
JavaScript的函式同時作為類的建構函式,因此只要宣告一個函式就可以使用new關鍵字建立類的例項。
1function Person(name) {
2  this.name = name;
3  this.toString = function() {
4    return 'Hello, ' + this.name + '!';
5  };
6}
7 
8var p = new Person('Ghostheaven');
9alert(p); // Hello, Ghostheaven!
在以上例項中Person函式作為類的建構函式使用,此時this指向新建立的例項物件,可以為例項增加屬性和方法,關於詳細的物件導向的JavaScript程式設計可以參考這篇文章。這裡我想要說的是,JavaScript函式作為類建構函式使用時的返回值問題。
1function MyClass(name) {
2  this.name = name;
3  return name;  // 建構函式的返回值?
4}
5 
6var obj1 = new MyClass('foo');
7var obj2 = MyClass('foo');
8var obj3 = new MyClass({});
9var obj4 = MyClass({});
上面的建構函式比較特別,有返回語句,那麼obj1~obj4分別指向什麼物件呢?實際結果是這樣的:
  • obj1 = MyClass物件
  • obj2 = 'foo'
  • obj3 = {}
  • obj4 = {}
具體原因這篇文章有解釋,本文不再贅述,由於帶返回值的建構函式會產生奇怪的結果,因此不要在建構函式中呼叫有返回值的返回語句(空return可以)。

三、JavaScript函式妖怪級

歡迎來到妖怪級函式授課區,在這裡會交給你如何淡定自如地面對老怪。。。

3.1 Function類
在JavaScript執行時中有一個內建的類叫做Function,用function關鍵字宣告一個函式其實是建立Function類物件的一種簡寫形式,所有的函式都擁有Function類所有的方法,例如call、apply、bind等等,可以通過instanceof關鍵字來驗證這個說法。
既然Function是一個類,那麼它的建構函式就是Function(它本身也是Function類的物件),應該可以通過new關鍵字來生成一個函式物件。第一個妖怪來了,那就是如何用Function類構造一個函式。Function的語法如下:
1new Function ([arg1[, arg2[, ... argN]],] functionBody)
其中arg1, arg2, ... argN是字串,代表引數名稱,functionBody也是字串,表示函式體,前面的引數名稱是可多可少的,Function的建構函式會把最後一個引數當做函式體,前面的都當做引數處理。
1var func1 = new Function('name', 'return "Hello, " + name + "!";');
2func1('Ghostheaven'); // Hello, Ghostheaven!
以上方法就通過Function構造了一個函式,這個函式跟其他用function關鍵字宣告的函式一模一樣。
看到這兒,很多人可能會問為什麼需要這樣一個妖怪呢?“存在的即是合理的”,Function類有它獨特的用途,你可以利用它動態地生成各種函式邏輯,或者代替eval函式的功能,而且能保持當前環境不會被汙染*。

3.2 自更新函式(Self-update Function)
在很多語言中,函式一旦宣告過就不能再次宣告同名函式,否則會產生語法錯誤,而在JavaScript中的函式不僅可以重複宣告,而且還可以自己更新自己。自己吃自己的妖怪來了!
01function selfUpdate() {
02  window.selfUpdate = function() {
03    alert('second run!');
04  };
05 
06  alert('first run!');
07}
08 
09selfUpdate(); // first run!
10selfUpdate(); // second run!
這種函式可以用於只執行一次的邏輯,在第一次執行之後就整個替換成一段新的邏輯。

小結

JavaScript的函式灰常強大,在漂亮地解決很多問題的同時,也帶來很多負面問題。妖怪級別的函式使用方法通常是一些鮮為人知的用法,除非特別必要不要輕易使用,否則會造成程式碼閱讀困難,影響團隊開發效率。

* 在新的ECMAScript中引入了嚴格模式,在嚴格模式下eval函式受到了很大的限制,也能夠保證環境不被汙染

相關文章