Java 8中的Stream API使用指南

InfoQ - 廖雪峰發表於2014-12-02

Java 8引入了全新的Stream API。這裡的Stream和I/O流不同,它更像具有Iterable的集合類,但行為和集合類又有所不同。

Stream API引入的目的在於彌補Java函數語言程式設計的缺陷。對於很多支援函數語言程式設計的語言,map()、reduce()基本上都內建到語言的標準庫中了,不過,Java 8的Stream API總體來講仍然是非常完善和強大,足以用很少的程式碼完成許多複雜的功能。

建立一個Stream有很多方法,最簡單的方法是把一個Collection變成Stream。我們來看最基本的幾個操作:

public static void main(String[] args) {
    List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
    Stream<Integer> stream = numbers.stream();
    stream.filter((x) -> {
        return x % 2 == 0;
    }).map((x) -> {
        return x * x;
    }).forEach(System.out::println);
}

集合類新增的stream()方法用於把一個集合變成Stream,然後,通過filter()、map()等實現Stream的變換。Stream還有一個forEach()來完成每個元素的迭代。

為什麼不在集合類實現這些操作,而是定義了全新的Stream API?Oracle官方給出了幾個重要原因:

一是集合類持有的所有元素都是儲存在記憶體中的,非常巨大的集合類會佔用大量的記憶體,而Stream的元素卻是在訪問的時候才被計算出來,這種“延遲計算”的特性有點類似Clojure的lazy-seq,佔用記憶體很少。

二是集合類的迭代邏輯是呼叫者負責,通常是for迴圈,而Stream的迭代是隱含在對Stream的各種操作中,例如map()。

要理解“延遲計算”,不妨建立一個無窮大小的Stream。

如果要表示自然數集合,顯然用集合類是不可能實現的,因為自然數有無窮多個。但是Stream可以做到。

自然數集合的規則非常簡單,每個元素都是前一個元素的值+1,因此,自然數發生器用程式碼實現如下:

class NaturalSupplier implements Supplier<Long> {

    long value = 0;

    public Long get() {
        this.value = this.value + 1;
        return this.value;
    }
}

反覆呼叫get(),將得到一個無窮數列,利用這個Supplier,可以建立一個無窮的Stream:

public static void main(String[] args) {
    Stream<Long> natural = Stream.generate(new NaturalSupplier());
    natural.map((x) -> {
        return x * x;
    }).limit(10).forEach(System.out::println);
}

對這個Stream做任何map()、filter()等操作都是完全可以的,這說明Stream API對Stream進行轉換並生成一個新的Stream並非實時計算,而是做了延遲計算。

當然,對這個無窮的Stream不能直接呼叫forEach(),這樣會無限列印下去。但是我們可以利用limit()變換,把這個無窮Stream變換為有限的Stream。

利用Stream API,可以設計更加簡單的資料介面。例如,生成斐波那契數列,完全可以用一個無窮流表示(受限Java的long型大小,可以改為BigInteger):

class FibonacciSupplier implements Supplier<Long> {

    long a = 0;
    long b = 1;

    @Override
    public Long get() {
        long x = a + b;
        a = b;
        b = x;
        return a;
    }
}

public class FibonacciStream {

    public static void main(String[] args) {
        Stream<Long> fibonacci = Stream.generate(new FibonacciSupplier());
        fibonacci.limit(10).forEach(System.out::println);
    }
}

如果想取得數列的前10項,用limit(10),如果想取得數列的第20~30項,用:

List<Long> list = fibonacci.skip(20).limit(10).collect(Collectors.toList());

最後通過collect()方法把Stream變為List。該List儲存的所有元素就已經是計算出的確定的元素了。

用Stream表示Fibonacci數列,其介面比任何其他介面定義都要來得簡單靈活並且高效。

計算π可以利用π的展開式:

π/4 = 1 - 1/3 + 1/5 - 1/7 + 1/9 - ...

把π表示為一個無窮Stream如下:

class PiSupplier implements Supplier<Double> {

    double sum = 0.0;
    double current = 1.0;
    boolean sign = true;

    @Override
    public Double get() {
        sum += (sign ? 4 : -4) / this.current;
        this.current = this.current + 2.0;
        this.sign = ! this.sign;
        return sum;
    }
}

Stream<Double> piStream = Stream.generate(new PiSupplier());
piStream.skip(100).limit(10)
        .forEach(System.out::println);

這個級數從100項開始可以把π的值精確到3.13~3.15之間:

3.1514934010709914
3.1317889675734545
3.1513011626954057
3.131977491197821
3.1511162471786824
3.1321589012071183
3.150938243930123
3.132333592767332
3.1507667724908344
3.1325019323081857

利用尤拉變換對級數進行加速,可以利用下面的公式:

用程式碼實現就是把一個流變成另一個流:

class EulerTransform implements Function<Double, Double> {

    double n1 = 0.0;
    double n2 = 0.0;
    double n3 = 0.0;

    @Override
    public Double apply(Double t) {
        n1 = n2;
        n2 = n3;
        n3 = t;
        if (n1 == 0.0) {
            return 0.0;
        }
        return calc();
    }

    double calc() {
        double d = n3 - n2;
        return n3 - d * d / (n1 - 2 * n2 + n3);
    }
}

Stream<Double> piStream2 = Stream.generate(new PiSupplier());
piStream2.map(new EulerTransform())
         .limit(10)
         .forEach(System.out::println);

可以在10項之內把π的值計算到3.141~3.142之間:

0.0
0.0
3.166666666666667
3.1333333333333337
3.1452380952380956
3.13968253968254
3.1427128427128435
3.1408813408813416
3.142071817071818
3.1412548236077655

還可以多次應用這個加速器:

Stream<Double> piStream3 = Stream.generate(new PiSupplier());
piStream3.map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .map(new EulerTransform())
         .limit(20)
         .forEach(System.out::println);

20項之內可以計算出極其精確的值:

...
3.14159265359053
3.1415926535894667
3.141592653589949
3.141592653589719

可見用Stream API可以寫出多麼簡潔的程式碼,用其他的模型也可以寫出來,但是程式碼會非常複雜。

作者簡介

廖雪峰,十年軟體開發經驗,業餘產品經理,精通Java/Python/Ruby/Visual Basic/Objective C/Lisp等程式語言,對開源框架有深入研究,著有《Spring 2.0核心技術與最佳實踐》一書,多個業餘開源專案託管在GitHub。

相關文章