這個遞迴不太難

Wise.Wrong發表於2020-07-03

這個遞迴不太難

相信大家都知道什麼是遞迴,但在實際開發的時候用過多少次遞迴呢?

程式的世界有句話叫“人用迴圈,神用遞迴”,很多情況下我們都會優先使用迴圈而不是遞迴。我和幾個朋友聊過,他們的看法是:“相比迴圈而言,遞迴效能更差,而且更不可控,容易出問題。”

捕獲關鍵詞“問題”,啟動“解決”模式...


一、先熱個身

數學家高斯的在念小學的時候,他的數學老師出了一道題:對自然數1到100求和。高斯用首尾相加的辦法很快的算出了答案,不過我們這次要扮演高斯的同學,老老實實的從1加到100。

首先試一下迴圈的思路:

function sum(n) {
    let count = 0;
    for (let i = 1; i <= n; i++) {
    	count += i;
    }
    return count;
}
sum(100); // 5050

可以看到迴圈體只有一行程式碼

count += i;

如果把 count 當成是一個函式的返回值,一個基本的遞迴邏輯就成型了:

function sum(n) {
    return n + sum(n-1);
}
// 這裡的 sum(n-1) 不能寫成 sum(n--)

但僅僅這樣是不夠的,還差一個關鍵程式碼塊——開關

遞迴本身是一個無限迴圈,需要新增控制條件,讓程式在合適的時候退出迴圈

function sum(n) {
		if (n === 1) {
			return n;
		}
    return n + sum(n-1);
}
sum(100); // 5050

試試 sum(20000) 的結果是多少?


二、三大要素

上面的例子已經完成了一個簡單的遞迴,回頭總結一下,我們主要做了兩件事:

  1. 遞迴的拆解 —— 提取重複的邏輯,縮小問題規模
  2. 遞迴的出口 —— 明確遞迴的結束條件

其實在這之前,我們還做了一件事,這件事很重要,但常常會被我們忽略掉:

  1. 遞迴的定義 —— 明確函式的功能

這三大要素是寫遞迴的必要條件,而其中的第三點,是寫好一個遞迴的必要條件。


以經典的樹元件作為案例,來印證一下這三要素。

樹元件的主要功能,就是將一個規範的具有層級的陣列,渲染成樹列表

由此我們能明確這個函式的主要功能:接收一個陣列入參,返回一個完整的樹元件

好像大概可能應該也許有點問題?

還是先來觀察陣列吧。每個元素的 titlekey 是固定的,只是非葉子節點有 children。而 children 內部的結構也是 titlekey,加一個可能有的 children

這樣一來就能很容易的提取出重複的邏輯:渲染樹節點,以 children 作為遞迴結束的判斷條件

為了更好的 UI 展示,還需要記錄樹節點的層級來計算當前節點的縮排。

我們只是在渲染樹節點,而不是渲染整個樹!

之所以能渲染出整個樹,是因為在函式執行的過程中,產生了很多的樹節點,這些樹節點組成了一個樹。

所以我們這個函式功能應該是:接收一個陣列作為必要引數,和一個數值作為可選引數,並返回一個樹節點

重新捋一下思路,這個渲染樹元件的函式就清晰多了:

renderTree = (list, level = 1) => {
  return list.map(x => {
    const { children, id } = x || {};
    if (children) { // 遞迴的結束條件
      return (
        <TreeNode key={`${id}`} level={level}>
          {/* 呼叫自身,形成遞迴 */}
          {renderTreeNodes(children, level + 1)}
        </TreeNode>
      );
    }
    // 遞迴的出口
    return <TreeNode key={`${id}`} level={level}></TreeNode>
  })
}

三、遞迴優化 - 手動快取

當我們去分析一個迴圈的時候,能清晰的看出這個函式的內部邏輯和執行次數。

而遞迴則不然,它的結構更加簡潔,但也增加了理解成本。比如下面這個遞迴,你能一眼看出它的執行次數麼?

function Fibonacci (n) {
  return n <= 2 ? 1 : Fibonacci(n - 1) + Fibonacci(n - 2);
}

這就是著名的 Fibonacci 數列,我盡力避免拿它舉例,後來發現這個例子最為簡單直觀。

Fibonacci 數列:1, 1, 2, 3, 5, 8, 13, 21...

f(n) = f(n-1) + f(n-2)

我們試著執行一下 Fibonacci(10),並記錄該函式的呼叫次數

居然執行了 109 次?

其實回頭分析一下 Fibonacci 這個函式就能發現,執行的時候存在很多的重複計算,比如計算 Fibonacci(5)

-- f(5)
| -- f(4)
| | -- f(3)
| | | -- f(2)
| | | -- f(1)
| | -- f(2)
| -- f(3)
| | -- f(2)
| | -- f(1)

葉子節點會被重複計算,層次越深,計算的次數就越多

這裡有兩個優化思路,第一種是從當前的邏輯上,新增一層快取,如果當前入參已經計算過,就直接返回結果。

// 快取函式
function memozi(fn){
	const obj = {};
  return function(n){
    obj[n] = obj[n] || fn(n);
    return obj[n];
  }
}

const Fibonacci = memozi(function(n) {
  return n <= 2 ? 1 : Fibonacci(n - 1) + Fibonacci(n - 2);
})

只執行了10次!這已經達到了迴圈的執行次數。

這是一種空間換時間的思想,增加了額外的變數來記錄狀態,不過函式的實際呼叫次數並沒有減少,只是在 memozi 函式中做了判斷。

怎麼才能真正實現 O(n) 的時間複雜度呢?


四、遞迴優化 - 自下而上

上面所有的遞迴都是自上而下的遞迴,從 n 開始,一直計算到最小值。但在 Fibonacci 的例子中,如果需要計算 f(n),就需要先計算 f(n-1),所以一定會存在重複計算的情況。

能不能從最小值開始計算呢?

在明確了 f(n) = f(n-1) + f(n-2) 規則的前提下,同時又知道 f(1) = 1, f(2) = 1,那就能推斷出 f(3) = 2,乃至 f(4), f(5)...

從而得到一個基本邏輯:

function foo(x = 1, y = 1) {
  return foo(y, x + y);
}

這裡的 xy 就是對應 n=1n=2 的時候的值,然後逐步計算出 n=3, n=4... 的值。

然後加入 n <= 2 的邊界,得到最終的遞迴函式:

function Fibonacci(n, x = 1, y = 1) {
  return n <= 2 ? y : Fibonacci(n - 1, y, x + y);
}

我們僅僅是稍微調整了函式的邏輯,就達到了 O(n) 的時間複雜度。這種自下而上的思想,其實是動態規劃的體現。


動態規劃是一種尋求最優解的數學方法,它經常會被當做一種演算法,但它其實並不像“二分查詢”、“氣泡排序”一樣有著固定的正規化。實際上動態規劃是一種方法論,它提供的是一種解決問題的思路。

簡單來說,動態規劃將一個複雜的問題分解成若干個子問題,通過綜合子問題的最優解來得到原問題的最優解。而且動態規劃是自下而上求解,先計運算元問題,再由這些子問題計算父問題,直至求解出原問題的解,將時間複雜度優化為 O(n)

動態規劃有三個重要概念:

  1. 最優子結構
  2. 邊界

光看名詞就覺得有點似曾相識。沒錯,這就是前文提到的遞迴三要素中的“縮小問題規模”和“結束條件”。

而動態規劃的第三個概念,才是其核心所在:

  1. 狀態轉移方程

所謂狀態轉移方程,就是子問題與父問題之間的關係,或者說:如何用子問題推匯出父問題

通常我們用遞迴都是自上而下,是先遇到了父問題,再去解決子問題。而動態規劃是先解決子問題,再通過狀態轉移方程求解出父問題,也就是自下而上。這種自下而上的遞迴也被稱為“遞推”


動態規劃的適用範圍,也是自下而上的適用範圍:

  1. 存在最優子結構

    作為整個過程的最優策略,應當具有這樣的特質:無論過去的狀態和決策如何,相對於前面的決策所形成的狀態而言,餘下的決策序列必然構成最優子策略。

    也就是說,一個最優策略的子策略也是最優的。

  2. 無後效性

    如果某階段狀態給定後,則在這個階段以後過程的發展不受這個階段以前各段狀態的影響。

    也就是說,計算f(i),不需要f(i+1)...f(n)的值,也不會修改f(1)...f(i-1)的值(1 < i < n)。

只要滿足這兩點,就可以用自下而上的思路來優化。

不過上面自下而上求解 Fibonacci 數列的函式,除了動態規劃之外,還使用了尾呼叫


五、遞迴優化 - 尾呼叫

函式在呼叫的時候,會在呼叫棧 (call stack) 中存有記錄,每一條記錄叫做一個呼叫幀 (call frame)。每呼叫一個函式,就向棧中 push 一條記錄,函式執行結束後依次向外彈出,直到清空呼叫棧。

function foo () { console.log('wise'); }
function bar () { foo(); }
function baz () { bar(); }

baz();

造成這種結果是因為每個函式在呼叫另一個函式的時候,並沒有 return 該呼叫,所以 JS 引擎會認為你還沒有執行完,會保留你的呼叫幀。

如果對上面的例子做如下修改:

function foo () { console.log('wise'); }
function bar () { return foo(); }
function baz () { return bar(); }

baz();

上面的改動其實是函數語言程式設計中的一個重要概念,當一個函式執行時的最後一個步驟是返回另一個函式的呼叫,這就叫做尾呼叫(PTC)如果是在遞迴裡面使用,即在函式的末尾呼叫自身,就是尾遞迴


回頭來看最開始的求 1~n 之和的例子:

function sum(n) {
		if (n === 1) {
			return n;
		}
    return n + sum(n-1);
}
sum(100); // 5050

如果執行 sum(20000)棧溢位(爆棧):

Uncaught RangeError: Maximum call stack size exceeded

將這個遞迴升級為尾遞迴:

function sum(n, count = 0) {
		if (n === 1) {
			return count + n;
		}
    return sum(n-1, count+n);
}

現在呼叫棧中的呼叫幀始終只有一條,相對節省記憶體,這樣的遞迴就靠譜了許多


尾呼叫對遞迴的意義重大,但在實際運用的時候卻備受阻礙。

首先需要使用嚴格模式"use strict",其次主流瀏覽器只有 Safari 支援尾呼叫(上面的截圖就是在 Safari 截的),ChromeFirefox 甚至 node 都不支援尾呼叫優化。

Chrome V8 團隊給出的解釋是:

  1. 由於尾呼叫消除呼叫幀是隱式的,這意味著開發者可能很難發現一些無限迴圈的遞迴,如果它們恰好出現在末尾,因為這些遞迴的堆疊將不再溢位。
  2. 尾呼叫會丟失堆疊資訊,這將導致執行流中的堆疊資訊丟失,這將影響程式除錯和錯誤收集。

不過即使如此,ChromeMozilla 依然認可尾呼叫優化所帶來的的效能提升,只是在引擎層面還沒有找到一個很安全可靠的方案來支援尾呼叫優化。微軟曾經提議從語法上來指定尾呼叫(類似於 return continue 這樣的特殊語句),不過最終方案仍在討論中。

雖然大部分的瀏覽器還不支援尾遞迴,但我們在開發的時候依然可以優先使用尾呼叫,畢竟執行的效果是一樣的,而一旦程式在支援尾遞迴的環境下執行,就會有更快的執行速度。更重要的是,當我們嘗試使用尾遞迴的時候,通常會自然而然的用到自下而上的思想。


六、小結

我們一般認為遞迴會比迴圈的效能要差,是因為函式呼叫本身是有開銷的。

但如果能實現尾遞迴,那麼遞迴的效率應該至少和迴圈一樣好。

對於不能使用尾呼叫的遞迴,即使寫成了迴圈的形式,也只是拿一個棧來模擬遞迴的過程。會帶來一定的效率提升,但也會造成程式碼的冗餘。

關於迴圈和(優化之後的)遞迴之間的取捨,我覺得可以從以下幾個方面判斷:

  1. 遞迴的優點是程式碼簡潔,邏輯清晰。缺點是呼叫幀導致的執行效率過低,而且不如迴圈容易理解;
  2. 遞迴和迴圈完全可以互換,但遞迴可以處理的問題,如果通過迴圈去解決,通常需要額外的低效處理;
  3. 如果邏輯相對簡單,使用迴圈也很簡潔,可以優先考慮迴圈;
  4. 在無法使用尾遞迴的環境,迴圈永遠是優先考慮的解決方案,但如果能接受遞迴的效能開銷,建議使用遞迴。

我認為遞迴其實是一種思維方式。所謂的“遞迴比迴圈慢”,指的是遞迴的各種實現。

掌握遞迴的意義不在於編碼本身,而在於知道如何編碼。

Premature optimization is the root of all evil.

過早優化是萬惡之源。

—— 《計算機程式設計藝術》Donald Knuth


參考資料:

《遞迴優化:尾呼叫和Memoization》—— LumiereXyloto

《尾呼叫優化》—— 阮一峰

《【譯】V8 團隊眼中的 ES6、ES7及未來》—— 奇舞團

《什麼是動態規劃(Dynamic Programming)?動態規劃的意義是什麼?》—— 苗華棟


相關文章