我對遞迴的理解和總結

yiifburj發表於2021-01-30

原文網址 : https://www.cnblogs.com/yiifburj/p/14350553.html

看了自己的動態記錄，發現自己已經遺忘了曾經的自己，有一條動態，2013年的時候，我看了一篇關於尾遞迴的博文，那時候還只是一個初學者，胡亂評論了一下，作者希望我能寫一篇博文發表一下自己的看法，當時沒有寫，然而現在卻想寫點什麼總結一下，不保證說的沒問題，只希望如果有像我當年一樣的初學者看到，可以參考借鑑，或許能有些幫助，在此也感謝給我啟發，教會我知識的陌生朋友們。

1. 遞迴就是一個函式直接或間接的自己呼叫自己，間接就是f0 -> f1 -> f0 ->f1這種，但也就是一個名詞而已，並不神奇，它只是一個普普通通的函式呼叫，但由於自己呼叫自己這個特性，有一種自動化的力量，給它一個規則，它可以自動的持續執行下去，直到觸發停止條件。一個遞迴函式就像是一個簡單的計算機。

2. 所有的遞迴都可以用迴圈來替代，所有的迴圈也都可以用遞迴來替代，兩者是等價的。

3. 遞迴是人腦的直接思維方式，迴圈是當前多數(我所知道的所有的)cpu的直接思維方式。

4. 對於cpu來講，函式呼叫只是暫存器，記憶體，跳轉等操作，如果不涉及額外棧空間使用（極簡單函式的特殊情況），函式呼叫和迴圈的差別可能僅僅是使用的暫存器不同。

5. 遞迴可以把複雜的問題變得簡單，是一種處理問題的模型。比如漢諾塔，快速排序，二叉樹遍歷和查詢，如果學會使用遞迴這種思維方式思考問題，很多問題會變得很簡單，大事化小，小事化了，每一步都是很簡單的操作。

6. 正確的思維會使問題很簡單，錯誤的思維會讓人發懵，使用遞迴的思考方式是忘記呼叫的是自己，自己呼叫的是任意一個函式，那個函式有沒有實現，是否實現得正確不是我現在要關心的事，我只要保證，在那個函式正確實現的前提下，我現在寫的這個函式是沒問題的，當我寫完當前函式的時候，被呼叫的函式也就寫完了(副產物)，因為它們是同一個，這有點像數學歸納法。

7. 正確的實現一個遞迴函式，需要保證有退出的條件，除非你是在寫一個死迴圈，同時隨著遞迴層數變深，問題逐漸簡單化，規模逐漸縮小，或者是向退出條件逼近(收斂)。

8. 遞迴對棧空間的佔用分兩種，尾遞迴開啟相應的優化之後不會導致棧空間使用不停擴大，非尾遞迴對棧空間的呼叫要看遞迴的層數，遞迴層數是可預測的，一般二分的遞迴(理想的情況，極端的情況二叉樹會變成連結串列，這時候已經不是二分法了，但二叉樹是可以事先保證平衡的)層數大約為log2(n)，30層函式呼叫使用的棧空間很少(使用超級龐大的陣列區域性變數這樣的特殊情況除外)，但是n是10億級別，這個時候要關注的已經不是棧空間了，而是儲存資料的記憶體空間或cpu等資源，比如用遞迴方法計算Fibonacci數列，現在的個人電腦預設棧空間(M級別)，不可能棧溢位的，忙不過來的是cpu，多分的情況棧空間一般都不會過深，原因是一邊呼叫增加深度，一邊返回減少深度，用完全平衡二叉樹為例，畫一個圖看一下呼叫過程就一目瞭然。

下面就棧空間的使用，尾遞迴，遞迴迴圈的轉換等問題詳細分析。

除非是特殊的情況，編譯器能優化成不使用棧空間，否則遞迴是需要棧空間的，這和任何一個函式呼叫都是一樣的，對於解決實際問題的函式，一般沒有不需要棧空間的，在函式呼叫的時候，需要儲存cpu暫存器到棧空間（用於恢復函式的執行），區域性變數也有可能會導致棧空間的使用，每一個函式執行的時候區域性變數都會佔用一次棧空間，每一次函式呼叫也會觸發一次棧空間的使用，這就是每一次遞迴呼叫的棧空間代價，函式呼叫總是有呼叫就有返回的，最大代價就是最大遞迴層數，尾遞迴是一種特殊情況，考慮下面的函式。

int f(int n)
{
    if(n <= 0)
       return n;
    // body;
    return f(n-1);
}

return f(n-1);是函式f的最後一個語句。f(n-1)的返回值就是f(n)的返回值，也就是說對於當前函式f(n)已經沒有必要儲存現場了，它的棧空間不需要恢復了，f(n-1)返回到f(n)，f(n)再向上返回，那為什麼要留個中介呢，為什麼不直接向上返回呢，所以棧空間中儲存的返回地址等不動，進入f(n)時儲存的暫存器(callee-saved registers)不動，也就是f(n)的上層現場不動，他們直接繼承給f(n-1)，f(n-1)不再
儲存它的返回地址(f(n)的最後)，也不再儲存使用的暫存器(f(n)已經不需要恢復了)，f(n)的區域性變數使用的棧空間直接被f(n-1)的給覆蓋掉，同樣的邏輯再向上遞推，會發現，每一層函式呼叫引起的棧空間佔用都相當於沒有了，實際上上述程式碼就變成了

int f(int n)
{
    while( n > 0 )
    {
        //body;
        n--;
    }
    return n;
}

這種遞迴叫做尾遞迴，即遞迴呼叫之後不需要再有額外的操作，並且遞迴之前沒有其他遞迴呼叫，開啟優化之後（gcc, O2預設開啟）編譯器可以將尾遞迴優化成迴圈。

再考慮下面的函式

int f(int n)
{
    if(n <= 0)
       return n;
    // body;
    return n + f(n-1);
}

這種遞迴呼叫是無法直接變成迴圈的，這裡用直接，是因為這種情況太簡單了，編譯器不會那麼傻，gcc O1就會變成迴圈，為什麼不能直接變成迴圈呢，因為f(n-1)之後還有其他操作（返回值+n），為了繼續其他操作能夠繼續執行，呼叫f(n-1)之前需要儲存現場，需要用到棧空間，每一層呼叫都會儲存一次棧空間，這時候棧空間的佔用是O(n)的，因為不是二分，三分，n的數量稍大一點就會導致棧溢位。當然這裡實在是太簡單了！換個複雜的，編譯器就不會優化了（只是寫本文的時候用的gcc，不排除以後編譯器越來越智慧的可能）。

unsigned long fib(int n)
{
    if(n < 2)
       return 1;
    return fib(n-1) + fib(n-2);
}

fib(3) 呼叫 fib(2)和fib(1)，假定編譯器生成的指令是先呼叫fib(2)，那麼就要在棧空間中儲存現場，以便fib(2)返回的時候能夠繼續執行fib(1)和一個加法操作，fib(2)呼叫fib(1)和fib(0)，還是假定先呼叫左邊的，呼叫fib(1)的時候需要儲存現場，然後返回1, 恢復現場，儲存現場，呼叫fib(0)，然後恢復現場，加法運算，然後再返回上層，即fib(2)返回，恢復現場，fib(2)下面的所有呼叫佔用的棧空間都已釋放了(遞減棧棧頂暫存器數值增加)，然後儲存現場，呼叫fib(1)，返回1, 恢復現場，加法運算，返回，整個fib(3)就是這樣完成的，可見每次呼叫+左邊的分支的時候，遞迴層數會增加一層，每次呼叫+右面的分支的時候，左面增加的層數都已經恢復，這是一個動態增減的過程，遞迴層數是有限的。這種Fibonacci數列演算法慢的根源在於重複計算。不重複計算的方法如下：

unsigned long fib2(int n,  unsigned long left, unsigned long right)
{
    if( n < 2 )
        return right;
    return fib2(n - 1, right, left+right);
}

這裡是一個尾遞迴，相當於迴圈, 當然如果不優化，棧空間佔用是O(n)，n足夠大是會溢位的。

可見，迴圈和尾遞迴是直接互相轉換的，迴圈變數相當於函式中的引數，迴圈退出條件相當於函式退出的條件，迴圈變數的增減相當於引數傳遞時的增減計算，迴圈體相當於函式體，所以像scheme這樣的程式語言沒有迴圈但是並不影響表達能力。

Fibonacci數列迴圈的演算法是從數列的左邊開始，不符合直觀定義，需要知道原理才能想到，直觀的定義是從右到左，然而左邊又沒有準備好，所以需要借用棧。

考慮一個更明顯的例子，單向非迴圈連結串列的正向遍歷和逆向遍歷，前者是尾遞迴(迴圈)，後者非尾遞迴(使用迴圈需要藉助棧)，正向遍歷不需要額外的棧空間，但是如何實現逆向遍歷呢？首先要拿到最後一個節點，但是訪問完最後一個節點了，到哪裡去找上一個節點呢，單向連結串列並沒有prev指標，很明顯，需要在記憶體中儲存，由於訪問的順序是後進先出，用的應該是棧這種模型，而函式呼叫本來就是棧的模型的，所以如果使用函式呼叫的方式是很自然的，很符合人的思維邏輯的，用遞迴的方式都不用考慮棧的問題，因為這是一種很自然的符合人的邏輯的思考模型，程式碼如下：

struct list{
    int c;
    struct list *next;
};

#define print_list(list) (void)list
void visit(const struct list *cur)
{
    if(cur == NULL)
        return;
    print_list(cur);
    visit(cur->next);
}
void visit_reverse(const struct list *cur)
{
    if(cur == NULL)
        return;
    // 訪問後面的，怎麼訪問的不用管，會有人保證它的逆序
    visit_reverse(cur->next);
    // 後面的全都訪問完了，訪問當前的
    print_list(cur);
}

#define list_append(tail_p, cur) ((*tail_p)->next = cur, (*tail_p) = cur)
struct list * _list_reverse(struct list *cur, struct list **tail_after_reverse)
{
    // 最後一個
    if(cur->next == NULL)
    {
        // 記錄末尾，方便list_append
        *tail_after_reverse = cur;
        return cur;
    }
    struct list *head = _list_reverse(cur->next, tail_after_reverse);
    list_append(tail_after_reverse, cur);
    return head;
}
// 逆序單向連結串列
struct list * list_reverse(struct list *cur)
{
    struct list *tail_after_reverse;
    if(cur == NULL)
        return cur;
    struct list *head = _list_reverse(cur, &tail_after_reverse);
    list_append(&tail_after_reverse, NULL);
    return head;
}

尾遞迴和迴圈可以互相轉換，這是很明顯的，那麼非尾遞迴如何和迴圈互相轉換呢，理論上是一定可以完成的，因為對於cpu來講遞迴就是用棧來實現的，下面以二叉樹的先序，中序，後序的遍歷方式來舉例說明，不過能夠實現不代表應該這樣做，程式碼的可讀性和見解性非常重要，並且轉變成迴圈也未必就能感受到效能的變化。

#include <assert.h>
#include <stdio.h>


struct tree{
    int n;
    struct tree *left;
    struct tree *right;
};

static const void *stack[128];
static char stack_flag[128];
static int stack_i;
#define visit(t) printf("%d\t", t->n)
#define push(x) do{if(x) stack[stack_i++] = x;}while(0)
#define pop() (stack_i == 0 ? NULL : stack[--stack_i])
#define push2(x, flag) do{if(x) {stack[stack_i] = x; stack_flag[stack_i++] = flag;}}while(0)
#define pop2(flag) (stack_i == 0 ? NULL : ((flag=stack_flag[--stack_i]), (stack_flag[stack_i] = 0), stack[stack_i]))

// 二叉樹的先序遍歷
//
// 遞迴版本
void preorder(const struct tree *t){
    if(t == NULL)
        return;
    visit(t);
    preorder(t->left);
    preorder(t->right);
}

// 迴圈版本
// 如何變成迴圈呢，方法就是遞迴怎麼來，我們就怎麼來，
// 1. 呼叫visit，但是呼叫之後要恢復兩個函式呼叫，為了恢復現場，需要在棧空間中儲存後續要做的事，我們這裡顯然不需要儲存cpu暫存器等，只需要儲存t->left和t->right就可以了，由於是先呼叫t->left，後呼叫t->right，所以入棧就要反過來。
//push(t->right);
//push(t->left);
//能不能直接push(t)呢，答案是不能，除非標記t已經訪問過了，否則就迴圈訪問t了，但是標記t訪問過了還是要把t->right和t->left入棧，不如就直接來，更直接。
// 2. t訪問完了，遞迴程式就恢復現場，返回到visit的下一個地址執行，恢復現場就對應我們的出棧，繼續執行同樣的preorder邏輯就相當於我們重複一次迴圈，
// 3. 遞迴程式繼續這個過程，直到函式棧上的最底層，也就是最後一個函式呼叫返回，對應我們的繼續這個過程，直到棧裡面沒有資料了為止。
// 程式碼如下
void preorder_loop0(const struct tree *in)
{
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        visit(t);
        push(t->right);
        push(t->left);
    }while((t = pop()) != NULL);
}
//這個程式是最原始的貼近遞迴的版本，還可以繼續優化，visit(t)之後pop出來的一定是t->left，那麼下次一定是visit(t->left)，往下遞推，每一次都是visit(t->left)，也就是說按照一直向左的方向遍歷就可以了，需要入棧的只是右子樹，但是右子樹誰先誰後呢，從遞迴程式可以看出，所有的左子樹成員都在右子樹的前面遍歷，也就是說最接近樹根的大叉是優先順序最低的，遠離樹根的在左子樹上的右子樹更優先，也就是說，入棧的順序和訪問的順序相同，即
//

void preorder_loop1(const struct tree *in)
{
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        while(t)
        {
            visit(t);
            push(t->right);
            t = t->left;
        }
    }while((t = pop()) != NULL);
}
// 將上面兩種版本對比，想象一下preorder_loop0的執行過程，也可以直接優化為preorder_loop1

//中序遍歷
// 遞迴版本
void inorder(const struct tree *t){
    if(t == NULL)
        return;
    inorder(t->left);
    visit(t);
    inorder(t->right);
}

// 第一步還是按照和遞迴一一對應的方式來轉換成迴圈，這個地方有點複雜，因為第一個函式不是visit，本身就是個遞迴的，這時候的處理方式不唯一，可以直接把遞迴版本函式中最上面的那個inorder展開，也可以按照通用的迴圈中的邏輯來處理那個inorder，前者直接就是優化之後的了。另外由於inorder和visit是兩種操作，為了區分是哪一種操作，還需要在入棧的時候加標記等。
void inorder_loop0(const struct tree *in)
{
    int is_visit = 0;
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        if(is_visit)
            visit(t);
        else
        {
            push2(t->right, 0);
            push2(t, 1);
            push2(t->left, 0);
        }
    }while((t = pop2(is_visit)) != NULL);
}
// 簡化push(t->left); 同preorder的方法
void inorder_loop1(const struct tree *in)
{
    int is_visit = 0;
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        if(is_visit)
            visit(t);
        else
        {
            while(t)
            {
                push2(t->right, 0);
                push2(t, 1);
                t = t->left;
            }
        }
    }while((t = pop2(is_visit)) != NULL);
}
// 繼續優化，每次pop出來的一定是先visit的，然後接著就是它的right，那麼兩者可以合成一個整體，這樣也不用標記是否是is_visit了
void inorder_loop2(const struct tree *in)
{
    const struct tree *t = in;
    if(t == NULL)
        return;

    while(t)
    {
        push(t);
        t = t->left;
    }
    while((t = pop()) != NULL)
    {
        visit(t); // pop -> t
        if(t->right) // pop -> t->right
        {
            t = t->right;
            while(t)
            {
                push(t);
                t = t->left;
            }
        }
    }
}

// 後續遍歷
// 遞迴版本
void postorder(const struct tree *t){
    if(t == NULL)
        return;
    postorder(t->left);
    postorder(t->right);
    visit(t);
}
// 和中序遍歷相同的方式，唯一一個區別就是 visit(t) 和postorder(t->right)的順序換了一下，也就是入棧的順序換了一下。程式碼如下：
void postorder_loop0(const struct tree *in)
{
    int is_visit = 0;
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        if(is_visit)
            visit(t);
        else
        {
            push2(t, 1);
            push2(t->right, 0);
            push2(t->left, 0);
        }
    }while((t = pop2(is_visit)) != NULL);
}

// 前面已經用過這種思路，去掉push t->left(附帶的pop也一起去掉了)
void postorder_loop1(const struct tree *in)
{
    int is_visit = 0;
    const struct tree *t = in;
    if(t == NULL)
        return;
    do{
        if(is_visit)
            visit(t);
        else
        {
            while(t)
            {
                push2(t, 1);
                push2(t->right, 0);
                t = t->left;
            }
        }
    }while((t = pop2(is_visit)) != NULL);
}

// t->right 先出棧，處理完整棵樹才能繼續處理t(即visit(t))，所以t和t->right不能當成一個整體來優化
// 但仍然可以繼續優化，t->right的處理過程是先push 它自己，也就是說visit(t)的時候上一次pop一定是
// t->right，並且pop -> t->right 然後pop -> t 的時候一定是訪問t的時候，這是後序遍歷的定義的必然
// 即 t->right == NULL 或last_pop/visit == t->right就是visit(t)的時刻，這樣可以去掉is_visit的標記
// 使用更簡單的push 和 pop
void postorder_loop2(const struct tree *in)
{
    const struct tree *t = in, *last_visit = NULL;
    if(t == NULL)
        return;

    while(t)
    {
        push(t);
        push(t->right);
        t = t->left;
    }
    while((t = pop()) != NULL)
    {
        if(t->right == NULL || last_visit == t->right)
        {
            visit(t);
            last_visit = t;
        }
        else
        {
            while(t)
            {
                push(t);
                push(t->right);
                t = t->left;
            }
        }
    }
}

int main(int argc, char *argv[])
{
    /*
     *
     *                        4
     *                     /    \
     *                   2        6
     *                 /  \      /   \
     *                1    3    5      8
     *                                / \
     *                               7   9
     *
     *
     */
    struct tree t[9] = {
        {1, NULL,NULL},
        {2, &t[0],&t[2]},
        {3, NULL,NULL},
        {4, &t[1],&t[5]},
        {5, NULL,NULL},
        {6, &t[4],&t[7]},
        {7, NULL,NULL},
        {8, &t[6],&t[8]},
        {9, NULL,NULL},
    };
    preorder(&t[3]);
    puts("");
    assert(stack_i == 0);
    preorder_loop0(&t[3]);
    assert(stack_i == 0);
    puts("");
    preorder_loop1(&t[3]);
    assert(stack_i == 0);
    puts("");
    inorder(&t[3]);
    assert(stack_i == 0);
    puts("");
    inorder_loop0(&t[3]);
    assert(stack_i == 0);
    puts("");
    inorder_loop1(&t[3]);
    assert(stack_i == 0);
    puts("");
    inorder_loop2(&t[3]);
    puts("");
    postorder(&t[3]);
    puts("");
    assert(stack_i == 0);
    postorder_loop0(&t[3]);
    assert(stack_i == 0);
    puts("");
    postorder_loop1(&t[3]);
    assert(stack_i == 0);
    puts("");
    postorder_loop2(&t[3]);
    assert(stack_i == 0);
    return 0;
}

尾遞迴和非尾遞迴是否能轉換呢，對於Fibonacci數列這樣的特殊情況當然可以，但有些問題就是遞迴模型，比如快速排序，所以是無法直接轉換的，如果非要轉換的話，也是可以的，藉助額外實現的棧，因為迴圈和尾遞迴是等價的，迴圈加額外的棧能實現的，尾遞迴加額外的棧也能實現，但是這樣做是否有意義呢，人工精心優化的迴圈/尾遞迴程式和非尾遞迴相比，有時候也許能獲得少量效能提升，但是程式碼的可讀性卻很差，而非尾遞迴程式卻是非常直觀。

補充一點，看編譯器是否進行了尾遞迴優化，可以通過gdb或objdump看彙編，看尾遞迴發生的時候後面是否有其他操作，或者是否還有遞迴的呼叫，gcc O2一定會優化的，如果通過試驗測試，建議數字要足夠大，因為優化之後的程式可能佔用棧空間很小，而程式的棧空間可能又很大，所以沒有進行尾遞迴優化依然可能不會棧溢位。

總之，遞迴是一種非常好的模型，棧空間一般可預測，尾遞迴因為利用函式實現，區域性變數隔離，也會增加安全性，但是記得開優化，儘量不用棧和迴圈替代遞迴，增加程式碼可讀性。

遞迴和遞推總結
2019-01-24
遞迴
遞迴總結
2024-12-01
遞迴
理解遞迴
2019-03-14
遞迴
理解遞迴 Recurtion
2019-02-21
遞迴
遞迴函式的理解
2021-06-07
遞迴函式
對遞迴和迭代的效率的思考和分析
2019-02-16
遞迴
遞迴和尾遞迴
2024-03-18
遞迴
徹底理解遞迴，從遞迴的本質說起！
2019-06-26
遞迴
用 JavaScript 的方式理解遞迴
2018-10-25
JavaScript遞迴
遞迴思想的巧妙理解
2020-11-05
遞迴
遞迴轉非遞迴棧模擬 Recursive to Non-recursive stack simulated 總結
2018-09-07
遞迴
【進階篇】Java 專案中對使用遞迴的理解分享
2024-07-02
Java遞迴
什麼是遞迴?遞迴和迴圈的異同
2020-12-25
遞迴
我對部落格的理解和看法
2019-03-28
python 遞迴樹狀結構和排序
2024-03-25
Python遞迴排序
圖形輔助，理解遞迴
2019-06-07
遞迴
資料結構和演算法面試題系列—遞迴演算法總結
2018-09-30
資料結構演算法面試題遞迴
資料結構與演算法學習總結--遞迴
2020-10-08
資料結構演算法遞迴
資料結構和演算法：遞迴
2020-08-26
資料結構演算法遞迴
我對抽象的理解
2020-04-04
抽象
Vue3.0的遞迴監聽和非遞迴監聽
2020-10-28
Vue遞迴
遞迴 & 分治演算法深度理解
2020-09-01
遞迴演算法
舉例說明你對尾遞迴的理解，有哪些應用場景
2024-05-28
遞迴
JavaScript和ABAP的尾遞迴
2020-09-14
JavaScript遞迴
連結串列與遞迴
2019-01-19
遞迴
通用-遞迴樹結構
2024-03-27
遞迴
資料結構-遞迴
2020-01-31
資料結構遞迴
我理解的javascript事件迴圈(一)
2018-08-07
JavaScript事件
Oracle和Mysql遞迴
2019-04-11
OracleMySql遞迴
遞迴和非遞迴分別實現求n的階乘
2018-11-29
遞迴
關於Vue中插槽的理解和總結
2020-11-12
Vue
我對JavaScript物件的理解
2019-03-04
JavaScript物件
[最全演算法總結]我是如何將遞迴演算法的複雜度優化到O(1)的
2019-07-16
演算法遞迴複雜度優化
遞迴求填空結果的python程式
2020-02-22
遞迴Python
我的總結
2019-10-21
Android遍歷所有控制元件的遞迴和非遞迴實現
2018-09-30
Android控制元件遞迴
?30 秒瞭解尾遞迴和尾遞迴優化
2019-03-18
遞迴優化
目標和——遞迴的實踐
2020-12-17
遞迴

我對遞迴的理解和總結

相關文章