Java 提效神器 Stream 的冷門技巧

徐筆筆發表於2021-07-02

Stream

使用這個方法建立一個 Stream 物件。

new ArrayList<>().stream()

Filter

過濾器,裡面傳遞一個函式,這個函式的返回結果如果為 true 則保留這個元素,否則的話丟棄這個元素。

        stringCollection
                .stream()
                .filter((s) -> s.startsWith("a"))
                .forEach(System.out::println);

Foreach

遍歷,消費。

        stringCollection
                .stream()
                .filter((s) -> s.startsWith("a"))
                .forEach(System.out::println);

Map

這個功能也是遍歷,但是他是有返回值的,而上面的 Foreach 是沒有返回值的,僅僅是單純的消費。而且 Foreach 不能夠鏈式呼叫,因為沒有返回值,但是 Map 沒問題。

        stringCollection
                .stream()
                .map(String::toUpperCase)
                .sorted(Comparator.reverseOrder())
                .forEach(System.out::println);

Sorted

這個方法是用來排序的,裡面傳遞的函式就是一個比較器,也可以不傳遞引數,使用預設的就好。

        stringCollection
                .stream()
                .sorted(( x, y)-> y.length()-x.length())
                .filter((s) -> s.startsWith("a"))
                .forEach(System.out::println);

Match

根據在給定的 stream 物件中是否含有指定內容返回 true 或者 false 。

具體的有:

  • allMatch
  • anyMatch
  • noneMatch
        boolean anyStartsWithA = stringCollection
                .stream()
                .anyMatch((s) -> s.startsWith("a"));

        boolean allStartsWithA = stringCollection
                .stream()
                .allMatch((s) -> s.startsWith("a"));

        boolean noneStartsWithZ = stringCollection
                .stream()
                .noneMatch((s) -> s.startsWith("z"));

count

計算集合中的元素的個數。

long startsWithB = stringCollection
        .stream()
        .filter((s) -> s.startsWith("b"))
        .count();

reduce

這個函式就是類似於斐波那契數列,每次傳遞的引數是上一次的結果和從集合中取出的新元素。第一次預設取出了第一個元素和第二個元素。

簡單的例子就是,第一次取出 0,1 第二次取出 第一次reduce的結果作為第一個引數,取出 2 作為第二個引數,以此類推。

Optional<String> reduced =
        stringCollection
                .stream()
                .sorted()
                .reduce((s1, s2) -> s1 + "#" + s2);

parallelStream

並行的 steam 流,可以進行並行處理,這樣會效率更高。在使用stream.foreach時這個遍歷沒有執行緒安全問題,但是使用parallelStream就會有執行緒安全問題,所有在parallelStream裡面使用的外部變數,比如集合一定要使用執行緒安全集合,不然就會引發多執行緒安全問題。如果說需要保證安全性需要使用 reduce 和 collect,不過這個用起來超級麻煩!!!

long count = values.parallelStream().sorted().count();

IntStream.range(a,b)

可以直接生成 從 a 到 b 的整數這裡還是遵循程式語言的大多數約定,那就是含頭不含尾。

IntStream.range(0, 10)
    .forEach(System.out::println);

輸出的結果是

0
1
2
3
4
5
6
7
8
9

new Random().ints()

獲取一系列的隨機值,這個介面出來的資料是連續不斷的,所以需要用limit來限制一下。

new Random().ints().limit(10).forEach(System.out::println);

Supplier

Supplier<String> stringSupplier=String::new;
stringSupplier.get();

該介面就一個抽象方法get方法,不用傳入任何引數,直接返回一個泛型T的例項.就如同無參構造一樣

Consumer

1. accept方法

​ 該函式式介面的唯一的抽象方法,接收一個引數,沒有返回值.

2. andThen方法

​ 在執行完呼叫者方法後再執行傳入引數的方法.

public class ConsumerTest {
 public static void main(String[] args) {
 Consumer<Integer> consumer = (x) -> {
 int num = x * 2;
 System.out.println(num);
        };
 Consumer<Integer> consumer1 = (x) -> {
 int num = x * 3;
 System.out.println(num);
        };
 consumer.andThen(consumer1).accept(10);
    }

先執行了 consumer.accept(10) 然後執行了 consumer1.accept(10)

ifPresent

針對一個optional 如果有值的話就執行否則不執行。

IntStream
    .builder()
    .add(1)
    .add(3)
    .add(5)
    .add(7)
    .add(11)
    .build()
    .average()
    .ifPresent(System.out::println);

average 執行結果就是一個 optional

Collect

他有兩種呼叫方式

  <R> R collect(Supplier<R> supplier,
 BiConsumer<R, ? super T> accumulator,
 BiConsumer<R, R> combiner);

 <R, A> R collect(Collector<? super T, A, R> collector);

下面主要介紹一下這兩種方式的使用方法:

1. 函式

第一種呼叫方式的介面如下

  <R> R collect(Supplier<R> supplier,
 BiConsumer<R, ? super T> accumulator,
 BiConsumer<R, R> combiner);
  • supplier 這個引數就是提供一個容器,可以看到最後 collect 操作的結果是一個 R 型別變數,而 supplier 介面最後需要返回的也是一個 R 型別的變數,所以說這裡返回的是收集元素的容器。
  • accumulator 引數,看到這個函式的定義是傳入一個 R 容器,後面則是 T 型別的元素,需要將這個 T 放到 R 容器中,即這一步是用來將元素新增到容器中的操作。
  • conbiner 這個引數是兩個容器,即當出現多個容器的時候容器如何進行聚合。

一個簡單的例子:

String concat = stringStream.collect(StringBuilder::new, StringBuilder::append,StringBuilder::append).toString();
//等價於上面,這樣看起來應該更加清晰
String concat = stringStream.collect(() -> new StringBuilder(),(l, x) -> l.append(x), (r1, r2) -> r1.append(r2)).toString();

2. Collector 介面

第二種方案是更高階的用法採用了 Collector 介面:

 <R, A> R collect(Collector<? super T, A, R> collector);

可以看到他返回的還是一個 R 型別的變數,也就是容器。

Collector介面是使得collect操作強大的終極武器,對於絕大部分操作可以分解為旗下主要步驟,提供初始容器->加入元素到容器->併發下多容器聚合->對聚合後結果進行操作

static class CollectorImpl<T, A, R> implements Collector<T, A, R> {
 private final Supplier<A> supplier;
 private final BiConsumer<A, T> accumulator;
 private final BinaryOperator<A> combiner;
 private final Function<A, R> finisher;
 private final Set<Characteristics> characteristics;

 CollectorImpl(Supplier<A> supplier,
 BiConsumer<A, T> accumulator,
 BinaryOperator<A> combiner,
 Function<A,R> finisher,
 Set<Characteristics> characteristics) {
 this.supplier = supplier;
 this.accumulator = accumulator;
 this.combiner = combiner;
 this.finisher = finisher;
 this.characteristics = characteristics;
        }

 CollectorImpl(Supplier<A> supplier,
 BiConsumer<A, T> accumulator,
 BinaryOperator<A> combiner,
 Set<Characteristics> characteristics) {
 this(supplier, accumulator, combiner, castingIdentity(), characteristics);
        }

        @Override
 public BiConsumer<A, T> accumulator() {
 return accumulator;
        }

        @Override
 public Supplier<A> supplier() {
 return supplier;
        }

        @Override
 public BinaryOperator<A> combiner() {
 return combiner;
        }

        @Override
 public Function<A, R> finisher() {
 return finisher;
        }

        @Override
 public Set<Characteristics> characteristics() {
 return characteristics;
        }
    }

可以看到我們可以直接 new CollectorImpl 然後將這些函式傳入,另外還有一種簡單的方式就是 使用 Collector.of()依然可以直接傳入函式。和 new CollectorImpl 是等價的。

3. 工具函式

1. toList()

容器: ArrayList::new
加入容器操作: List::add
多容器合併: left.addAll(right); return left;

 public static <T>
 Collector<T, ?, List<T>> toList() {
 return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
                                   (left, right) -> { left.addAll(right); return left; },
                                   CH_ID);
    }

2.joining()

容器: StringBuilder::new
加入容器操作: StringBuilder::append
多容器合併: r1.append(r2); return r1;
聚合後的結果操作: StringBuilder::toString

 public static Collector<CharSequence, ?, String> joining() {
 return new CollectorImpl<CharSequence, StringBuilder, String>(
                StringBuilder::new, StringBuilder::append,
                (r1, r2) -> { r1.append(r2); return r1; },
                StringBuilder::toString, CH_NOID);
    }

3.groupingBy()

roupingBytoMap的一種高階方式,彌補了toMap對值無法提供多元化的收集操作,比如對於返回Map<T,List<E>>這樣的形式toMap就不是那麼順手,那麼groupingBy的重點就是對Key和Value值的處理封裝.分析如下程式碼,其中classifier是對key值的處理,mapFactory則是指定Map的容器具體型別,downstream為對Value的收集操作.

 public static <T, K, D, A, M extends Map<K, D>>
 Collector<T, ?, M> groupingBy(Function<? super T, ? extends K> classifier,
 Supplier<M> mapFactory,
 Collector<? super T, A, D> downstream) {
       .......
    }

一個簡單的例子

//原生形式
   Lists.<Person>newArrayList().stream()
        .collect(() -> new HashMap<Integer,List<Person>>(),
            (h, x) -> {
 List<Person> value = h.getOrDefault(x.getType(), Lists.newArrayList());
 value.add(x);
 h.put(x.getType(), value);
            },
            HashMap::putAll
        );
//groupBy形式
Lists.<Person>newArrayList().stream()
        .collect(Collectors.groupingBy(Person::getType, HashMap::new, Collectors.toList()));
//因為對值有了操作,因此我可以更加靈活的對值進行轉換
Lists.<Person>newArrayList().stream()
        .collect(Collectors.groupingBy(Person::getType, HashMap::new, Collectors.mapping(Person::getName,Collectors.toSet())));
// 還有一種比較簡單的使用方式 只需要傳遞一個引數按照key來劃分
Map<Integer, List<Person>> personsByAge = persons
            .stream()
    .collect(Collectors.groupingBy(p -> p.age));

4.reducing()

reducing是針對單個值的收集,其返回結果不是集合家族的型別,而是單一的實體類T
容器: boxSupplier(identity),這裡包裹用的是一個長度為1的Object[]陣列,至於原因自然是不可變型別的鍋
加入容器操作: a[0] = op.apply(a[0], t)
多容器合併: a[0] = op.apply(a[0], b[0]); return a;
聚合後的結果操作: 結果自然是Object[0]所包裹的資料a -> a[0]
優化操作狀態欄位: CH_NOID

 public static <T> Collector<T, ?, T>
 reducing(T identity, BinaryOperator<T> op) {
 return new CollectorImpl<>(
 boxSupplier(identity),
                (a, t) -> { a[0] = op.apply(a[0], t); },
                (a, b) -> { a[0] = op.apply(a[0], b[0]); return a; },
                a -> a[0],
                CH_NOID);
    }

簡單來說這個地方做的事情和 reduce 是一樣的,第一個 id 傳入的就是 reduce 的初始值,只是他把它包裝成一個 長度為1的陣列了。

//原生操作
final Integer[] integers = Lists.newArrayList(1, 2, 3, 4, 5)
        .stream()
        .collect(() -> new Integer[]{0}, (a, x) -> a[0] += x, (a1, a2) -> a1[0] += a2[0]);
//reducing操作
final Integer collect = Lists.newArrayList(1, 2, 3, 4, 5)
        .stream()
        .collect(Collectors.reducing(0, Integer::sum));    
//當然Stream也提供了reduce操作
final Integer collect = Lists.newArrayList(1, 2, 3, 4, 5)
        .stream().reduce(0, Integer::sum)

相關文章