惰性求值——lodash原始碼解讀

我是leon發表於2018-08-18

原文網址 : https://juejin.im/post/5b784baf51882542ed141a84

前言

lodash受歡迎的一個原因，是其優異的計算效能。而其效能能有這麼突出的表現，很大部分就來源於其使用的演算法——惰性求值。本文將講述lodash原始碼中，惰性求值的原理和實現。

一、惰性求值的原理分析

惰性求值（Lazy Evaluation），又譯為惰性計算、懶惰求值，也稱為傳需求呼叫（call-by-need），是計算機程式設計中的一個概念，它的目的是要最小化計算機要做的工作。惰性求值中的引數直到需要時才會進行計算。這種程式實際上是從末尾開始反向執行的。它會判斷自己需要返回什麼，並繼續向後執行來確定要這樣做需要哪些值。

以下是How to Speed Up Lo-Dash ×100? Introducing Lazy Evaluation.（如何提升Lo-Dash百倍算力？惰性計算的簡介）文中的示例，形象地展示惰性求值。

function priceLt(x) {
   return function(item) { return item.price < x; };
}
var gems = [
   { name: 'Sunstone', price: 4 },
   { name: 'Amethyst', price: 15 },
   { name: 'Prehnite', price: 20},
   { name: 'Sugilite', price: 7  },
   { name: 'Diopside', price: 3 },
   { name: 'Feldspar', price: 13 },
   { name: 'Dioptase', price: 2 },
   { name: 'Sapphire', price: 20 }
];
 
var chosen = _(gems).filter(priceLt(10)).take(3).value();
複製程式碼

程式的目的，是對資料集gems進行篩選，選出3個price小於10的資料。

1.1 一般的做法

如果拋開lodash這個工具庫，讓你用普通的方式實現var chosen = _(gems).filter(priceLt(10)).take(3);那麼，可以用以下方式：
_(gems)拿到資料集，快取起來。
再執行filter方法，遍歷gems陣列（長度為10），取出符合條件的資料：

[
   { name: 'Sunstone', price: 4 },
   { name: 'Sugilite', price: 7  },
   { name: 'Diopside', price: 3 },
   { name: 'Dioptase', price: 2 }
]
複製程式碼

然後，執行take方法，提取前3個資料。

[
   { name: 'Sunstone', price: 4 },
   { name: 'Sugilite', price: 7  },
   { name: 'Diopside', price: 3 }
]
複製程式碼

總共遍歷的次數為：10+3。執行的示例圖如下：

1.2 惰性求值做法

普通的做法存在一個問題：每個方法各做各的事，沒有協調起來浪費了很多資源。
如果能先把要做的事，用小本本記下來?，然後等到真正要出資料時，再用最少的次數達到目的，豈不是更好。
惰性計算就是這麼做的。
以下是實現的思路：

_(gems)拿到資料集，快取起來
遇到filter方法，先記下來
遇到take方法，先記下來
遇到value方法，說明時機到了
把小本本拿出來，看下要求：要取出3個數，price<10
使用filter方法裡的判斷方法priceLt對資料進行逐個裁決

[
    { name: 'Sunstone', price: 4 }, => priceLt裁決 => 符合要求，通過 => 拿到1個
    { name: 'Amethyst', price: 15 }, => priceLt裁決 => 不符合要求
    { name: 'Prehnite', price: 20}, => priceLt裁決 => 不符合要求
    { name: 'Sugilite', price: 7  }, => priceLt裁決 => 符合要求，通過 => 拿到2個
    { name: 'Diopside', price: 3 }, => priceLt裁決 => 符合要求，通過 => 拿到3個 => 夠了，收工！
    { name: 'Feldspar', price: 13 },
    { name: 'Dioptase', price: 2 },
    { name: 'Sapphire', price: 20 }
]
複製程式碼

如上所示，一共只執行了5次，就把結果拿到。
執行的示例圖如下：

1.3 小結

從上面的例子可以得到惰性計算的特點：

延遲計算，把要做的計算先快取，不執行
資料管道，逐個資料通過“裁決”方法，在這個類似安檢的過程中，進行過關的操作，最後只留下符合要求的資料
觸發時機，方法快取，那麼就需要一個方法來觸發執行。lodash就是使用value方法，通知真正開始計算

二、惰性求值的實現

依據上述的特點，我將lodash的惰性求值實現進行抽離為以下幾個部分：

2.1 實現延遲計算的快取

實現_(gems)。我這裡為了語義明確，採用lazy(gems)代替。

var MAX_ARRAY_LENGTH = 4294967295; // 最大的陣列長度

// 快取資料結構體
function LazyWrapper(value){
    this.__wrapped__ = value;
    this.__iteratees__ = [];
    this.__takeCount__ = MAX_ARRAY_LENGTH;
}

// 惰性求值的入口
function lazy(value){
    return new LazyWrapper(value);
}
複製程式碼

this.__wrapped__ 快取資料
this.__iteratees__ 快取資料管道中進行“裁決”的方法
this.__takeCount__ 記錄需要拿的符合要求的資料集個數

這樣，一個基本的結構就完成了。

2.2 實現`filter`方法

var LAZY_FILTER_FLAG = 1; // filter方法的標記

// 根據 篩選方法iteratee 篩選資料
function filter(iteratee){
    this.__iteratees__.push({
        'iteratee': iteratee,
        'type': LAZY_FILTER_FLAG
    });
    return this;
}

// 繫結方法到原型鏈上
LazyWrapper.prototype.filter = filter;
複製程式碼

filter方法，將裁決方法iteratee快取起來。這裡有一個重要的點，就是需要記錄iteratee的型別type。
因為在lodash中,還有map等篩選資料的方法，也是會傳入一個裁決方法iteratee。由於filter方法和map方法篩選方式不同，所以要用type進行標記。
這裡還有一個技巧：

(function(){
    // 私有方法
    function filter(iteratee){
        /* code */
    }

    // 繫結方法到原型鏈上
    LazyWrapper.prototype.filter = filter;
})();
複製程式碼

原型上的方法，先用普通的函式宣告，然後再繫結到原型上。如果工具內部需要使用filter，則使用宣告好的私有方法。
這樣的好處是，外部如果改變LazyWrapper.prototype.filter，對工具內部，是沒有任何影響的。

2.3 實現`take`方法

// 擷取n個資料
function take(n){
    this.__takeCount__ = n;
    return this;
};

LazyWrapper.prototype.take = take;
複製程式碼

2.4 實現`value`方法

// 惰性求值
function lazyValue(){
    var array = this.__wrapped__;
    var length = array.length;
    var resIndex = 0;
    var takeCount = this.__takeCount__;
    var iteratees = this.__iteratees__;
    var iterLength = iteratees.length;
    var index = -1;
    var dir = 1;
    var result = [];

    // 標籤語句
    outer:
    while(length-- && resIndex < takeCount){
        // 外層迴圈待處理的陣列
        index += dir;

        var iterIndex = -1;
        var value = array[index];

        while(++iterIndex < iterLength){
            // 內層迴圈處理鏈上的方法
            var data = iteratees[iterIndex];
            var iteratee = data.iteratee;
            var type = data.type;
            var computed = iteratee(value);

            // 處理資料不符合要求的情況
            if(!computed){
                if(type == LAZY_FILTER_FLAG){
                    continue outer;
                }else{
                    break outer;
                }
            }
        }

        // 經過內層迴圈，符合要求的資料
        result[resIndex++] = value;
    }

    return result;
}

LazyWrapper.prototype.value = lazyValue;

複製程式碼

這裡的一個重點就是：標籤語句


    outer:
    while(length-- && resIndex < takeCount){
        // 外層迴圈待處理的陣列
        index += dir;

        var iterIndex = -1;
        var value = array[index];

        while(++iterIndex < iterLength){
            // 內層迴圈處理鏈上的方法
            var data = iteratees[iterIndex];
            var iteratee = data.iteratee;
            var type = data.type;
            var computed = iteratee(value);

            // 處理資料不符合要求的情況
            if(!computed){
                if(type == LAZY_FILTER_FLAG){
                    continue outer;
                }else{
                    break outer;
                }
            }
        }

        // 經過內層迴圈，符合要求的資料
        result[resIndex++] = value;
    }

複製程式碼

當前方法的資料管道實現，其實就是內層的while迴圈。通過取出快取在iteratees中的裁決方法取出，對當前資料value進行裁決。
如果裁決結果是不符合，也即為false。那麼這個時候，就沒必要用後續的裁決方法進行判斷了。而是應該跳出當前迴圈。
而如果用break跳出內層迴圈後，外層迴圈中的result[resIndex++] = value;還是會被執行，這是我們不希望看到的。
應該一次性跳出內外兩層迴圈，並且繼續外層迴圈，才是正確的。
標籤語句，剛好可以滿足這個要求。

2.5 小檢測


var testArr = [1, 19, 30, 2, 12, 5, 28, 4];

lazy(testArr)
    .filter(function(x){
        console.log('check x='+x);
        return x < 10
    })
    .take(2)
    .value();

// 輸出如下：
check x=1
check x=19
check x=30
check x=2

// 得到結果： [1, 2]
複製程式碼

2.6 小結

整個惰性求值的實現，重點還是在資料管道這塊。以及，標籤語句在這裡的妙用。其實實現的方式，不只當前這種。但是，要點還是前面講到的三個。掌握精髓，變通就很容易了。

結語

惰性求值，是我在閱讀lodash原始碼中，發現的最大閃光點。
當初對惰性求值不甚理解，想看下javascript的實現，但網上也只找到上文提到的一篇文獻。
那剩下的選擇，就是對lodash進行剖離分析。也因為這，才有本文的誕生。
希望這篇文章能對你有所幫助。如果可以的話，給個star :)

最後，附上本文實現的簡易版lazy.js完整原始碼： github.com/wall-wxk/bl…

喜歡我文章的朋友，可以通過以下方式關注我：

「star」 或 「watch」 我的GitHub blog
RSS訂閱我的個人部落格：王先生的基地

PostgreSQL 原始碼解讀（164）- 查詢#84(表示式求值)
2019-04-09
SQL原始碼
利用Lambda表示式進行Java中的惰性求值
2018-08-28
Java
利用 Lambda 表示式實現 Java 中的惰性求值
2021-09-09
Java
lodash原始碼分析之isArguments
2019-02-16
原始碼
lodash原始碼分析之isObjectLike
2018-10-02
原始碼Object
閱讀lodash原始碼之旅陣列方法篇-compact和concat
2021-01-24
原始碼陣列
Python函數語言程式設計系列007：惰性求值
2021-10-12
Python函數程式設計
Lodash原始碼分析-hasIn.js
2018-03-12
原始碼JS
硬剛 lodash 原始碼之路，_.chunk
2020-07-03
原始碼
「讀懂原始碼系列2」我從 lodash 原始碼中學到的幾個知識點
2019-03-17
原始碼
函式正規化入門(惰性求值與函式式狀態)
2019-01-19
函式
PostgreSQL 原始碼解讀（3）- 如何閱讀原始碼
2018-08-02
SQL原始碼
每日原始碼分析 – lodash(slice.js)
2019-02-22
原始碼JS
每日原始碼分析 – lodash(clamp.js)
2019-02-27
原始碼LAMPJS
每日原始碼分析 – lodash(after.js)
2019-03-02
原始碼JS
硬剛 lodash 原始碼之路，compact & concat
2020-07-04
原始碼
lodash原始碼分析之List快取
2019-02-21
原始碼快取
Laravel 原始碼解讀
2019-03-29
Laravel原始碼
reselect原始碼解讀
2019-03-03
原始碼
Swoft 原始碼解讀
2019-02-16
原始碼
Seajs原始碼解讀
2019-03-04
JS原始碼
ReentrantLock原始碼解讀
2018-11-24
ReentrantLock原始碼
MJExtension原始碼解讀
2018-11-29
原始碼
Axios 原始碼解讀
2019-04-16
iOS原始碼
SDWebImage原始碼解讀
2019-01-18
Web原始碼
MJRefresh原始碼解讀
2018-12-06
原始碼
Handler原始碼解讀
2019-02-26
原始碼
LifeCycle原始碼解讀
2018-10-15
原始碼
LinkedHashMap原始碼解讀
2018-07-11
HashMap原始碼
ConcurrentHashMap原始碼解讀
2018-07-12
HashMap原始碼
Redux原始碼解讀
2018-05-01
Redux原始碼
ThreadLocal原始碼解讀
2018-04-26
thread原始碼
WeakHashMap，原始碼解讀
2019-09-07
HashMap原始碼
ThreadLocal 原始碼解讀
2019-04-01
thread原始碼
Masonry原始碼解讀
2018-12-28
原始碼
ZooKeeper原始碼解讀
2024-06-15
原始碼
HashMap原始碼解讀
2018-03-23
HashMap原始碼
FairyGUI原始碼解讀
2024-10-29
AIGUI原始碼