理解 Ruby 裡的 block

Xavier發表於2019-02-16

Ruby 裡的 block一般翻譯成程式碼塊,block 剛開始看上去有點奇怪,因為很多語言裡面沒有這樣的東西。事實上它還不錯。

First-class function and Higher-order function

First-class functionHigher-order function 是函數語言程式設計語言裡面的概念,聽起來好像很高階的樣子,其實很很簡單的。

First-class functions 是指在某些語言裡,函式是一等公民,可以把函式當做引數傳遞,
可以返回一個函式,可以把函式賦值個一個變數等等,反正就是正常值能做的事函式都能做。JavaScript 就是這樣的。舉個例子(下面的所有例子裡,當我提到
JavaScript 時,示例程式碼都用的 CoffeeScript):

greet = (name) ->
  return -> console.log "Hello, #{name}"

greetToMike = greet("Mike")
greetToMike() # => 輸出 "Hello, Mike"
a = greetToMike
a() # => 輸出 "Hello, Mike"

在上面的第四行裡,greet("Mike") 返回了一個函式,所以第五行裡才可以呼叫 greetToMike()輸出"Hello, Mike"。第六行把一個函式賦值給了a,所以第七行就可以呼叫這個函式了。

higher-order function 一般翻譯成高階函式,是指接受函式做引數或者返回函式的函式。
舉個非常常用的例子(用 JavaScript):

a = [ "a", "b", "c", "d" ]
a.map((x) -> x + `!`) #=> ["a!", "b!", "c!", "d!"]

上面例子裡 map 就接受了一個匿名函式作為引數。Array.prototype裡的很多方法,比如reduce, filter,every, some 等等都是高階函式,因為他們都接受函式作為引數。

高階函式非常強大,表達力很強,可以避免大量重複程式碼。總的來說,它就是個好東西。

Block 的本質

先來看一組 Ruby 和 CoffeeScript 程式碼的對比。

a = [ "a", "b", "c", "d" ]
a.map { |x| x + "!" } # => ["a!", "b!", "c!", "d!"]
a.reduce { |acc, x| acc + x} # => "abcd"
a = [ "a", "b", "c", "d" ]
a.map((x) -> x + `!`) # => ["a!", "b!", "c!", "d!"]
a.reduce((acc, x) -> acc + x) # => "abcd"

這兩組程式碼真的看起來超級像。我覺得這也暴露了 Ruby 的 block 的本質:高階函式的函式引數的變體

JavaScript 裡面的map 函式接受一個函式作為引數,但是 Ruby 裡的 map 卻接受一個
block 作為引數。

其實 matz 早在一本書裡《松本行弘的程式世界》裡說了:

最終來看,塊到底是什麼?

塊也可以看作只是高階函式的一種特殊形式的語法。

高階函式和塊的本質一樣

在 Ruby 裡,函式不是一等公民,沒有 first-class functions。但是在 Ruby
裡怎樣使用高階函式呢?答案就是使用 block。可以直接用 block,也可以用 lambda
或者 proc 把 block 轉換成 Proc 類的例項用。

我發現在 Ruby 裡使用 block 時,幾乎所有的情況下都可以用 JavaScript
的高階函式替代。

Enumerable 模組裡的所有方法都是典型的例子。事實上確實存在 JavaScript 版
的 Enumerable,比如 Prototype.js 就有個 Enumerable,用起來跟 Ruby版的幾乎一樣的。當然它是通過高階函式實現的。

與高階函式有何不同

除了語法上看上去有點不同外,有非常重要的兩點。

控制流操作

在 block 裡面可以用 break, next 等等這些在一般的迴圈裡才有的控制流操作,這些
在高階函式裡是用不了的。比如你可以試試在 JavaScript 裡用 forEach 而不用迴圈
實現個take_while 函式,真是相當彆扭的。比如之前 cnode 上就有人發帖問:nodejs的forEach不支援break嗎?,其實這個帖子下面回覆用 return 的基本上都是錯的,
someevery 這樣利用 短路求值 的特點確實可以 hack 一下,但是明顯不自然而且大大增加了別人理解程式碼的難度。

從這一點來看 block 確實還不錯的。

只有一個函式引數的高階函式

Ruby 裡一個方法只能接受一個 block 作為引數,大概就是類似於只有一個函式引數的高階
函式。看起來好像是受到限制了。其實那本《松本行弘的程式世界》對此也有點解釋。
大概是說了一個調查,在傾向於使用高階函式的 OCaml 的標準庫中,94%
的高階函式只有一個函式引數。所以說這點限制不是什麼問題。就我自己的體驗來說,在 JavaScript 裡,還從沒用到需要兩個函式引數的高階函式。

未說明的

嗯,這篇文章看起來有點太長了,所以我不打算寫下去了。其實還有一些重要的地方沒說。比如
Block 其實可以作為閉包用的。Ruby 裡用def定義方法時有點悲劇的,因為它不是閉包,接觸
不到它外面的變數。

name = "mike"
def greet
  puts "hello, #{name}"
end
hello # => in `greet`: undefined local variable or method `name` for main:Object (NameError)

但是用 block 就可以了

name = "mike"
define_method(:greet) do
  puts "hello, #{name}"
end
greet # => "hello, mike"

用 JavaScript 就根本不存在問題。

name = "mike"
greet = -> console.log "hello, #{name}"
greet() # => "hello, mike"

同理還有classmodule 關鍵字都會建立新的作用域而在裡面接觸不到外面的變數,
也可以用 block 解決。

還有那個 proclambda 的區別。其實我一直不理解為什麼會有人不用lambda
而跑去用 proc,明顯 procreturn 行為太不符合常識了。但是到頭來卻發現
block 的行為跟 proc 建立的物件的行為是一樣的,比如

def hello
  (1..10).each { |e| return e}
  return "hello"
end
hello # => 1

這感覺真是有點悲催。

結語

說了這麼多,就是因為在 Ruby 裡面函式不是一等公民,又想獲得函數語言程式設計的便利。

所以如果你覺得 Ruby 太複雜了,趕緊去學 Elixir,簡單優雅!

相關文章