JavaScript函數語言程式設計(一)

Stark偉發表於2016-08-25

一、引言

說到函數語言程式設計,大家可能第一印象都是學院派的那些晦澀難懂的程式碼,充滿了一大堆抽象的不知所云的符號,似乎只有大學裡的計算機教授才會使用這些東西。在曾經的某個時代可能確實如此,但是近年來隨著技術的發展,函數語言程式設計已經在實際生產中發揮巨大的作用了,越來越多的語言開始加入閉包,匿名函式等非常典型的函數語言程式設計的特性,從某種程度上來講,函數語言程式設計正在逐步“同化”指令式程式設計。

JavaScript 作為一種典型的多正規化程式語言,這兩年隨著React的火熱,函數語言程式設計的概念也開始流行起來,RxJS、cycleJS、lodashJS、underscoreJS等多種開源庫都使用了函式式的特性。所以下面介紹一些函數語言程式設計的知識和概念。

二、純函式

如果你還記得一些初中的數學知識的話,函式 f 的概念就是,對於輸入 x 產生一個輸出 y = f(x)。這便是一種最簡單的純函式。純函式的定義是,對於相同的輸入,永遠會得到相同的輸出,而且沒有任何可觀察的副作用,也不依賴外部環境的狀態。

下面來舉個例子,比如在Javascript中對於陣列的操作,有些是純的,有些就不是純的:

var arr = [1,2,3,4,5];

// Array.slice是純函式,因為它沒有副作用,對於固定的輸入,輸出總是固定的
// 可以,這很函式式
xs.slice(0,3);
//=> [1,2,3]
xs.slice(0,3);
//=> [1,2,3]

// Array.splice是不純的,它有副作用,對於固定的輸入,輸出不是固定的
// 這不函式式
xs.splice(0,3);
//=> [1,2,3]
xs.splice(0,3);
//=> [4,5]
xs.splice(0,3);
//=> []

在函數語言程式設計中,我們想要的是 slice 這樣的純函式,而不是 splice這種每次呼叫後都會把資料弄得一團亂的函式。

為什麼函數語言程式設計會排斥不純的函式呢?下面再看一個例子:

//不純的
var min = 18;
var checkage = age => age > min;

//純的,這很函式式
var checkage = age => age > 18;

在不純的版本中,checkage 這個函式的行為不僅取決於輸入的引數 age,還取決於一個外部的變數 min,換句話說,這個函式的行為需要由外部的系統環境決定。對於大型系統來說,這種對於外部狀態的依賴是造成系統複雜性大大提高的主要原因。

可以注意到,純的 checkage 把關鍵數字 18 硬編碼在函式內部,擴充套件性比較差,我們可以在後面的柯里化中看到如何用優雅的函式式解決這種問題。

純函式不僅可以有效降低系統的複雜度,還有很多很棒的特性,比如可快取性:

import _ from 'lodash';
var sin = _.memorize(x => Math.sin(x));

//第一次計算的時候會稍慢一點
var a = sin(1);

//第二次有了快取,速度極快
var b = sin(1);

三、函式的柯里化

函式柯里化(curry)的定義很簡單:傳遞給函式一部分引數來呼叫它,讓它返回一個函式去處理剩下的引數。

比如對於加法函式 var add = (x, y) => x + y ,我們可以這樣進行柯里化:

//比較容易讀懂的ES5寫法
var add = function(x){
    return function(y){
        return x + y
    }
}

//ES6寫法,也是比較正統的函式式寫法
var add = x => (y => x + y);

//試試看
var add2 = add(2);
var add200 = add(200);

add2(2); // =>4
add200(50); // =>250

對於加法這種極其簡單的函式來說,柯里化並沒有什麼大用處。

還記得上面那個 checkage 的函式嗎?我們可以這樣柯里化它:

var checkage = min => (age => age > min);
var checkage18 = checkage(18);
checkage18(20);
// =>true

事實上柯里化是一種“預載入”函式的方法,通過傳遞較少的引數,得到一個已經記住了這些引數的新函式,某種意義上講,這是一種對引數的“快取”,是一種非常高效的編寫函式的方法:

import { curry } from 'lodash';

//首先柯里化兩個純函式
var match = curry((reg, str) => str.match(reg));
var filter = curry((f, arr) => arr.filter(f));

//判斷字串裡有沒有空格
var haveSpace = match(/\s+/g);

haveSpace("ffffffff");
//=>null

haveSpace("a b");
//=>[" "]

filter(haveSpace, ["abcdefg", "Hello World"]);
//=>["Hello world"]

四、函式組合

學會了使用純函式以及如何把它柯里化之後,我們會很容易寫出這樣的“包菜式”程式碼:

h(g(f(x))); 

雖然這也是函式式的程式碼,但它依然存在某種意義上的“不優雅”。為了解決函式巢狀的問題,我們需要用到“函式組合”:

//兩個函式的組合
var compose = function(f, g) {
    return function(x) {
        return f(g(x));
    };
};

//或者
var compose = (f, g) => (x => f(g(x)));

var add1 = x => x + 1;
var mul5 = x => x * 5;

compose(mul5, add1)(2);
// =>15

我們定義的compose就像雙面膠一樣,可以把任何兩個純函式結合到一起。當然你也可以擴充套件出組合三個函式的“三面膠”,甚至“四面膠”“N面膠”。

這種靈活的組合可以讓我們像拼積木一樣來組合函式式的程式碼:

var first = arr => arr[0];
var reverse = arr => arr.reverse();

var last = compose(first, reverse);

last([1,2,3,4,5]);
// =>5

五、Point Free

有了柯里化和函式組合的基礎知識,下面介紹一下Point Free這種程式碼風格。

細心的話你可能會注意到,之前的程式碼中我們總是喜歡把一些物件自帶的方法轉化成純函式:

var map = (f, arr) => arr.map(f);

var toUpperCase = word => word.toUpperCase();

這種做法是有原因的。

Point Free這種模式現在還暫且沒有中文的翻譯,有興趣的話可以看看這裡的英文解釋:

https://en.wikipedia.org/wiki/Tacit_programming

用中文解釋的話大概就是,不要命名轉瞬即逝的中間變數,比如:

//這不Piont free
var f = str => str.toUpperCase().split(' ');

這個函式中,我們使用了 str 作為我們的中間變數,但這個中間變數除了讓程式碼變得長了一點以外是毫無意義的。下面改造一下這段程式碼:

var toUpperCase = word => word.toUpperCase();
var split = x => (str => str.split(x));

var f = compose(split(' '), toUpperCase);

f("abcd efgh");
// =>["ABCD", "EFGH"]

這種風格能夠幫助我們減少不必要的命名,讓程式碼保持簡潔和通用。當然,為了在一些函式中寫出Point Free的風格,在程式碼的其它地方必然是不那麼Point Free的,這個地方需要自己取捨。

六、宣告式與命令式程式碼

命令式程式碼的意思就是,我們通過編寫一條又一條指令去讓計算機執行一些動作,這其中一般都會涉及到很多繁雜的細節。

而宣告式就要優雅很多了,我們通過寫表示式的方式來宣告我們想幹什麼,而不是通過一步一步的指示。

//命令式
var CEOs = [];
for(var i = 0; i < companies.length; i++){
    CEOs.push(companies[i].CEO)
}

//宣告式
var CEOs = companies.map(c => c.CEO);

命令式的寫法要先例項化一個陣列,然後再對 companies 陣列進行for迴圈遍歷,手動命名、判斷、增加計數器,就好像你開了一輛零件全部暴露在外的汽車一樣,雖然很機械朋克風,但這並不是優雅的程式設計師應該做的。

宣告式的寫法是一個表示式,如何進行計數器迭代,返回的陣列如何收集,這些細節都隱藏了起來。它指明的是做什麼,而不是怎麼做。除了更加清晰和簡潔之外,map 函式還可以進一步獨立優化,甚至用直譯器內建的速度極快的 map 函式,這麼一來我們主要的業務程式碼就無須改動了。

函數語言程式設計的一個明顯的好處就是這種宣告式的程式碼,對於無副作用的純函式,我們完全可以不考慮函式內部是如何實現的,專注於編寫業務程式碼。優化程式碼時,目光只需要集中在這些穩定堅固的函式內部即可。

相反,不純的不函式式的程式碼會產生副作用或者依賴外部系統環境,使用它們的時候總是要考慮這些不乾淨的副作用。在複雜的系統中,這對於程式設計師的心智來說是極大的負擔。

七、尾聲

任何程式碼都是要有實際用處才有意義,對於JS來說也是如此。然而現實的程式設計世界顯然不如範例中的函式式世界那麼美好,實際應用中的JS是要接觸到ajax、DOM操作,NodeJS環境中讀寫檔案、網路操作這些對於外部環境強依賴,有明顯副作用的“很髒”的工作。

這對於函數語言程式設計來說也是很大的挑戰,所以我們也需要更強大的技術去解決這些“髒問題”。我會在下一篇文章中介紹函數語言程式設計的更加高階一些的知識,例如Functor、Monad等等概念。

八、參考

1、https://github.com/MostlyAdequate/mostly-adequate-guide

2、http://www.ibm.com/developerworks/cn/web/1006_qiujt_jsfunctional/

3、《JavaScript函數語言程式設計》【美】邁克爾·佛格斯

相關文章