JavaScript世界的一等公民 - 函式
轉帖於:http://software.intel.com/zh-cn/articles/javascript-first-class-citizen-function/?cid=sw:prccsdn229032
簡介
在很多傳統語言(C/C++/Java/C#等)中,函式都是作為一個二等公民存在,你只能用語言的關鍵字宣告一個函式然後呼叫它,如果需要把函式作為引數傳給另一個函式,或是賦值給一個本地變數,又或是作為返回值,就需要通過函式指標(function pointer)、代理(delegate)等特殊的方式周折一番。
而在JavaScript世界中函式卻是一等公民,它不僅擁有一切傳統函式的使用方式(宣告和呼叫),而且可以做到像簡單值一樣賦值、傳參、返回,這樣的函式也稱之為第一級函式(First-class Function)。不僅如此,JavaScript中的函式還充當了類的建構函式的作用,同時又是一個Function類的例項(instance)。這樣的多重身份讓JavaScript的函式變得非常重要。
一、JavaScript函式入門級
JavaScript函式像一般語言一樣也是遵循先宣告後使用的原則,函式名只能包含字母、數字、下劃線或$,且不能以數字開頭。函式常見的宣告方式有以下兩種:
6 | var myfunc
= function ( )
{ |
注意,上面兩種函式宣告方式存在細微的差別:第一種方式在宣告時就是一個
命名的函式,無論是宣告在
呼叫之前、
呼叫之後,甚至是
不會執行到的位置(例如return語句之後或是永遠不會為真的分支裡),都在整個作用域可訪問;第二種方式是通過把匿名函式賦值給變數的方式,嚴格意義上說這不是一個函式的宣告(function declaration)而是一個函式表示式(function expression),在賦值之前這個函式不能被任何程式碼訪問到,也就是說這個
賦值必須在呼叫之前完成,否則呼叫時會出現錯誤:"TypeError:
undefined is not a function"。例如:
8 | var
myfunc2 = function() { |
函式的基本呼叫方式與傳統語言相同用一對括號呼叫: myfunc()。JavaScript的函式也支援直接或間接的遞迴(recursive)呼叫,例如經典的斐波那契函式用JavaScript可以這樣實現:
2 | if (n
== 1 || n == 2) { |
5 | return fib(n
- 2) + fib(n - 1); |
在JavaScript的函式可以處理變長引數,在函式內部都擁有一個名為arguments的區域性變數,它是一個類陣列(array-liked)的物件,裡面包含了所有呼叫時傳入的引數,有length屬性表示引數的個數。例如:
2 | alert(arguments.length); |
利用arguments可以實現類似C語言printf的功能,也可以用來實現方法的多型。
二、JavaScript函式進階
2.1 匿名函式和巢狀函式
在JavaScript可以宣告一個沒有名稱的函式,稱為匿名函式(Anonymouse Function)。同時JavaScript還允許在函式內部宣告函式,稱為巢狀函式(Nested Function),巢狀函式的作用域為整個父函式。
在前面函式宣告的部分就看到了匿名函式和巢狀函式的一種用法,由於匿名函式沒有名稱,不會引入新的變數汙染上下文環境,而且會帶來新的變數作用域,因此匿名函式常被用來防止全域性環境汙染。
JavaScript執行時中有一個特殊的全域性環境(global object),這個物件上面存放全域性的函式和變數,實際開發中經常會使用若干第三方的庫或多個js檔案,若不小心在全域性物件引入重複的變數或函式宣告,則會造成程式碼執行混亂。例如先後引入兩個js檔案,分別定義了自己的函式log作為內部使用,則第二引入的函式會覆蓋第一個的定義且不會丟擲任何錯誤,在後續的執行中呼叫log函式可能會造成錯誤。這時候使用一個匿名函式將整個js內的邏輯包裝起來,就可以避免這種錯誤,這種方法已經被絕大多數開源js庫使用。
以上程式碼就是一個簡單的示例,log函式的作用域被限制在這個匿名函式之內,而匿名函式則因為被外面一對小括號()包括起來,形成一個函式表示式,表示式的值是一個函式,緊接著一對小括號表示立即執行這個函式,讓原有的程式碼正常執行一次。不過,這種方式宣告的函式、通過var宣告的變數等等都是內部的,不能被任何匿名函式以外的程式碼訪問到。如果你需要對外暴露一些函式作為介面的話有如下幾種方法:
01 | var
mylib = (function(global) { |
2.2 高階函式(High-order Function)
如果函式作為引數或返回值使用時,就稱為高階函式,JavaScript中的函式都可以作為高階函式來使用,這也是第一類函式的特徵。下面我們就分別分析一下這兩種使用方法。
09 | function process(nums,
callback) { |
12 | for ( var i
= 0, length = nums.length; i < length; i++) { |
13 | result[i]
= callback(nums[i]); |
19 | var nums
= [-3, -2, -1, 0, 1, 2, 3, 4]; |
20 | var n_neg
= process(nums, negative); |
22 | var n_square
= process(nums, square); |
以上程式碼展示了把函式作為引數傳入另一個函式process呼叫的示例,在process函式的實現中,把callback作為一個黑盒子看待,負責把引數傳給它,然後獲取返回值,在呼叫之前並不清楚callback的具體實現。只有當執行到20行和22行時,callback才被分別代表negative或square,分別對每個元素進行取相反值或平方值的操作。
08 | var
gen1 = generator(); |
09 | var
gen2 = generator(); |
上面的程式碼展示了把函式作為返回值的示例,generator是一個自然數生成器函式,返回值是一個自然數生成函式。每次呼叫generator時都會把一個匿名函式作為結果返回,這個匿名函式在被實際呼叫時依次返回每個自然數。在generator裡的變數i在每次呼叫這個匿名函式時都會自增1,這其實就是一個閉包。下面我們來介紹一下閉包.
2.3 閉包(Closure)
閉包(Closure)並不是一個新鮮的概念,很多函式式語言中都使用了閉包。在JavaScript中,當你在內嵌函式中使用外部函式作用域內的變數時,就是使用了閉包。用一個常用的類比來解釋閉包和類(Class)的關係:類是帶函式的資料,閉包是帶資料的函式。
閉包中使用的變數有一個特性,就是它們不在父函式返回時釋放,而是隨著閉包生命週期的結束而結束。比如像上一節中generator的例子,gen1和gen2分別使用了相互獨立的變數i(在gen1的i自增1的時候,gen2的i並不受影響,反之亦然),只要gen1或gen2這兩個變數沒有被JavaScript引擎垃圾回收,他們各自的變數i就不會被釋放。在JavaScript程式設計中,不知不覺就會使用到閉包,閉包的這個特性在帶來易用的同時,也容易帶來類似記憶體洩露的問題。例如:
1 | var elem
= document.getElementById( 'test' ); |
2 | elem.addEventListener( 'click' , function ()
{ |
3 | alert( 'You
clicked ' +
elem.tagName); |
這段程式碼的作用是點選一個結點時顯示它的標籤名稱,它把一個匿名函式註冊為一個DOM結點的click事件處理函式,函式內引用了一個DOM物件elem,就形成了閉包。這就會產生一個迴圈引用,即:DOM->閉包->DOM->閉包...DOM物件在閉包釋放之前不會被釋放;而閉包作為DOM物件的事件處理函式存在,所以在DOM物件釋放前閉包不會釋放,即使DOM物件在DOM tree中刪除,由於這個迴圈引用的存在,DOM物件和閉包都不會被釋放。可以用下面的方法可以避免這種記憶體洩露:
1 | var elem
= document.getElementById( 'test' ); |
2 | elem.addEventListener( 'click' , function ()
{ |
3 | alert( 'You
clicked ' + this .tagName); |
上面這段程式碼中用this代替elem(在DOM事件處理函式中this指標指向DOM元素本身),讓JS執行時不再認為這個函式中使用了父類的變數,因此不再形成閉包。
閉包還會帶來很多類似的
記憶體洩露問題,只有在寫程式碼的時候著重注意一下閉包,儘量避免此類的問題產生。
2.4 類建構函式
JavaScript的函式同時作為類的建構函式,因此只要宣告一個函式就可以使用new關鍵字建立類的例項。
3 | this .toString
= function() { |
4 | return 'Hello,
' + this .name
+ '!' ; |
8 | var
p = new Person( 'Ghostheaven' ); |
在以上例項中Person函式作為類的建構函式使用,此時this指向新建立的例項物件,可以為例項增加屬性和方法,關於詳細的物件導向的JavaScript程式設計可以參考
這篇文章。這裡我想要說的是,JavaScript函式作為類建構函式使用時的返回值問題。
1 | function MyClass(name)
{ |
6 | var obj1
= new MyClass( 'foo' ); |
7 | var obj2
= MyClass( 'foo' ); |
8 | var obj3
= new MyClass({}); |
上面的建構函式比較特別,有返回語句,那麼obj1~obj4分別指向什麼物件呢?實際結果是這樣的:
- obj1 = MyClass物件
- obj2 = 'foo'
- obj3 = {}
- obj4 = {}
具體原因
這篇文章有解釋,本文不再贅述,由於帶返回值的建構函式會產生奇怪的結果,因此不要在建構函式中呼叫有返回值的返回語句(空return可以)。
三、JavaScript函式妖怪級
歡迎來到妖怪級函式授課區,在這裡會交給你如何淡定自如地面對老怪。。。
3.1 Function類
在JavaScript執行時中有一個內建的類叫做Function,用function關鍵字宣告一個函式其實是建立Function類物件的一種簡寫形式,所有的函式都擁有Function類所有的方法,例如call、apply、bind等等,可以通過instanceof關鍵字來驗證這個說法。
既然Function是一個類,那麼它的建構函式就是Function(它本身也是Function類的物件),應該可以通過new關鍵字來生成一個函式物件。第一個妖怪來了,那就是如何用Function類構造一個函式。Function的語法如下:
1 | new Function
([arg1[, arg2[, ... argN]],] functionBody) |
其中arg1, arg2, ... argN是字串,代表引數名稱,functionBody也是字串,表示函式體,前面的引數名稱是可多可少的,Function的建構函式會把最後一個引數當做函式體,前面的都當做引數處理。
1 | var func1
= new Function( 'name' , 'return
"Hello, " + name + "!";' ); |
以上方法就通過Function構造了一個函式,這個函式跟其他用function關鍵字宣告的函式一模一樣。
看到這兒,很多人可能會問為什麼需要這樣一個妖怪呢?“存在的即是合理的”,Function類有它獨特的用途,你可以利用它動態地生成各種函式邏輯,或者代替eval函式的功能,而且能保持當前環境不會被汙染*。
3.2 自更新函式(Self-update Function)
在很多語言中,函式一旦宣告過就不能再次宣告同名函式,否則會產生語法錯誤,而在JavaScript中的函式不僅可以重複宣告,而且還可以自己更新自己。自己吃自己的妖怪來了!
01 | function selfUpdate()
{ |
02 | window.selfUpdate
= function ()
{ |
這種函式可以用於只執行一次的邏輯,在第一次執行之後就整個替換成一段新的邏輯。
小結
JavaScript的函式灰常強大,在漂亮地解決很多問題的同時,也帶來很多負面問題。妖怪級別的函式使用方法通常是一些鮮為人知的用法,除非特別必要不要輕易使用,否則會造成程式碼閱讀困難,影響團隊開發效率。
* 在新的ECMAScript中引入了
嚴格模式,在嚴格模式下eval函式受到了很大的限制,也能夠保證環境不被汙染