Ruby 裡的 block
一般翻譯成程式碼塊,block 剛開始看上去有點奇怪,因為很多語言裡面沒有這樣的東西。事實上它還不錯。
First-class function and Higher-order function
First-class function 和 Higher-order function 是函數語言程式設計語言裡面的概念,聽起來好像很高階的樣子,其實很很簡單的。
First-class functions 是指在某些語言裡,函式是一等公民,可以把函式當做引數傳遞,
可以返回一個函式,可以把函式賦值個一個變數等等,反正就是正常值能做的事函式都能做。JavaScript 就是這樣的。舉個例子(下面的所有例子裡,當我提到
JavaScript 時,示例程式碼都用的 CoffeeScript):
greet = (name) ->
return -> console.log "Hello, #{name}"
greetToMike = greet("Mike")
greetToMike() # => 輸出 "Hello, Mike"
a = greetToMike
a() # => 輸出 "Hello, Mike"
在上面的第四行裡,greet("Mike")
返回了一個函式,所以第五行裡才可以呼叫 greetToMike()
輸出"Hello, Mike"
。第六行把一個函式賦值給了a
,所以第七行就可以呼叫這個函式了。
higher-order function 一般翻譯成高階函式,是指接受函式做引數或者返回函式的函式。
舉個非常常用的例子(用 JavaScript):
a = [ "a", "b", "c", "d" ]
a.map((x) -> x + `!`) #=> ["a!", "b!", "c!", "d!"]
上面例子裡 map 就接受了一個匿名函式作為引數。Array.prototype
裡的很多方法,比如reduce
, filter
,every
, some
等等都是高階函式,因為他們都接受函式作為引數。
高階函式非常強大,表達力很強,可以避免大量重複程式碼。總的來說,它就是個好東西。
Block 的本質
先來看一組 Ruby 和 CoffeeScript 程式碼的對比。
a = [ "a", "b", "c", "d" ]
a.map { |x| x + "!" } # => ["a!", "b!", "c!", "d!"]
a.reduce { |acc, x| acc + x} # => "abcd"
a = [ "a", "b", "c", "d" ]
a.map((x) -> x + `!`) # => ["a!", "b!", "c!", "d!"]
a.reduce((acc, x) -> acc + x) # => "abcd"
這兩組程式碼真的看起來超級像。我覺得這也暴露了 Ruby 的 block 的本質:高階函式的函式引數的變體。
JavaScript 裡面的map
函式接受一個函式作為引數,但是 Ruby 裡的 map
卻接受一個
block 作為引數。
其實 matz 早在一本書裡《松本行弘的程式世界》裡說了:
最終來看,塊到底是什麼?
…
塊也可以看作只是高階函式的一種特殊形式的語法。
…
高階函式和塊的本質一樣
…
在 Ruby 裡,函式不是一等公民,沒有 first-class functions。但是在 Ruby
裡怎樣使用高階函式呢?答案就是使用 block。可以直接用 block,也可以用 lambda
或者 proc
把 block 轉換成 Proc
類的例項用。
我發現在 Ruby 裡使用 block 時,幾乎所有的情況下都可以用 JavaScript
的高階函式替代。
Enumerable 模組裡的所有方法都是典型的例子。事實上確實存在 JavaScript 版
的 Enumerable,比如 Prototype.js 就有個 Enumerable,用起來跟 Ruby版的幾乎一樣的。當然它是通過高階函式實現的。
與高階函式有何不同
除了語法上看上去有點不同外,有非常重要的兩點。
控制流操作
在 block 裡面可以用 break
, next
等等這些在一般的迴圈裡才有的控制流操作,這些
在高階函式裡是用不了的。比如你可以試試在 JavaScript 裡用 forEach
而不用迴圈
實現個take_while 函式,真是相當彆扭的。比如之前 cnode 上就有人發帖問:nodejs的forEach不支援break嗎?,其實這個帖子下面回覆用 return 的基本上都是錯的, some
和 every
這樣利用 短路求值 的特點確實可以 hack 一下,但是明顯不自然而且大大增加了別人理解程式碼的難度。
從這一點來看 block 確實還不錯的。
只有一個函式引數的高階函式
Ruby 裡一個方法只能接受一個 block 作為引數,大概就是類似於只有一個函式引數的高階
函式。看起來好像是受到限制了。其實那本《松本行弘的程式世界》對此也有點解釋。
大概是說了一個調查,在傾向於使用高階函式的 OCaml 的標準庫中,94%
的高階函式只有一個函式引數。所以說這點限制不是什麼問題。就我自己的體驗來說,在 JavaScript 裡,還從沒用到需要兩個函式引數的高階函式。
未說明的
嗯,這篇文章看起來有點太長了,所以我不打算寫下去了。其實還有一些重要的地方沒說。比如
Block 其實可以作為閉包用的。Ruby 裡用def
定義方法時有點悲劇的,因為它不是閉包,接觸
不到它外面的變數。
name = "mike"
def greet
puts "hello, #{name}"
end
hello # => in `greet`: undefined local variable or method `name` for main:Object (NameError)
但是用 block 就可以了
name = "mike"
define_method(:greet) do
puts "hello, #{name}"
end
greet # => "hello, mike"
用 JavaScript 就根本不存在問題。
name = "mike"
greet = -> console.log "hello, #{name}"
greet() # => "hello, mike"
同理還有class
和 module
關鍵字都會建立新的作用域而在裡面接觸不到外面的變數,
也可以用 block 解決。
還有那個 proc
和 lambda
的區別。其實我一直不理解為什麼會有人不用lambda
而跑去用 proc
,明顯 proc
的 return
行為太不符合常識了。但是到頭來卻發現
block 的行為跟 proc
建立的物件的行為是一樣的,比如
def hello
(1..10).each { |e| return e}
return "hello"
end
hello # => 1
這感覺真是有點悲催。
結語
說了這麼多,就是因為在 Ruby 裡面函式不是一等公民,又想獲得函數語言程式設計的便利。
所以如果你覺得 Ruby 太複雜了,趕緊去學 Elixir,簡單優雅!