在Java中使用Lambda表示式統計詞頻

Subson發表於2017-05-31

在Java中使用Lambda表示式統計詞頻

常規方法

使用Java進行詞頻統計的常規方法步驟如下：

1. 初始化一個map物件例項（用於儲存單詞以及它的出現次數）和一個變數fre（用於詞頻臨時存放）
2. 遍歷每一個需要統計的單詞，進行如下操作
    a. 將fre賦值為1
    b. 判斷當前單詞在map中是否存在
        如果存在，則將fre加上該詞在map中存入詞頻
    c. 將當前單詞與fre存入map

以上步驟的程式碼實現如下：

Map<String, Integer> map = new HashMap<>();
int fre;
for(String word : words) {
    fre = 1;
    if(map.containsKey(word))
        fre += map.get(word);
    map.put(word, fre);
}

使用Lambda表示式

在學習閱讀State of the Lambda: Libraries Edition時，發現文中Collectors部分給出的最後一個程式碼例項存在一個小問題，即counting()方法返回的是長整型的資料型別Long，而Map卻是使用Integer接收，顯然是存在問題的。

文中的程式碼例項：

Pattern pattern = Pattern.compile(\\s+");
Map<String, Integer> wordFreq = 
    tracks.stream()
          .flatMap(t -> pattern.splitAsStream(t.name)) // Stream<String>
          .collect(groupingBy(s -> s.toUpperCase(),
                              counting()));

而counting()方法的定義如下：

public static <T> Collector<T, ?, Long>
counting() {
    return reducing(0L, e -> 1L, Long::sum);
}

故而，需要使用自定義的counting()方法，如上，僅需要做如下修改即可：

Pattern pattern = Pattern.compile(\\s+");
Map<String, Integer> wordFreq =
        tracks.stream()
            .flatMap(t -> pattern.splitAsStream(t.name)) // Stream<String>
            .collect(groupingBy(s -> s.toUpperCase(),
                                Collectors.reducing(0, e -> 1, Integer::sum)));

假設所有需要統計的單詞存於List陣列中，那麼使用該方法進行詞頻統計程式碼如下：

// List<String> list = new ArrayList<>();
// list.add("aa a b A h z B");
// list.add("a a b A h z B");
// list.add("a a b A h z B");
// list.add("a a b A h z B");

Pattern pattern = Pattern.compile("\\s+");
Map<String, Integer> wordFreq =
    list.stream()
            .flatMap(t -> pattern.splitAsStream(t))
            .collect(groupingBy(s -> s, Collectors.reducing(0, e -> 1, Integer::sum)));

在集合（List）上呼叫stream()生成該集合元素的流檢視，然後採用將一個返回流的函式傳入flatMap()，這樣會產生每個單詞，最後將這些詞進行統計存入Map中。

Java中Lambda表示式的使用
2020-12-31
Java
Java lambda表示式基本使用
2022-11-26
Java
Java 中的 Lambda 表示式
2020-10-27
Java
Java中lambda表示式詳解
2019-07-21
Java
Java | Lambda表示式
2018-09-30
Java
Lambda表示式（Java)
2018-04-12
Java
Java Lambda表示式
2024-06-02
Java
在Android Studio中使用Lambda表示式
2018-09-19
Android
Java中Lambda表示式基礎及使用詳解
2021-08-24
Java
Java中Lambda表示式的應用
2024-07-14
Java
Java8中的Lambda表示式
2021-04-16
Java
Java 8 Lambda 表示式
2019-01-24
Java
Java的Lambda表示式
2019-01-19
Java
java 8 lambda表示式
2018-03-16
Java
Java之lambda表示式
2021-03-27
Java
Java中使用lambda表示式自定義排序
2024-08-17
Java排序
Java中Lambda表示式的進化之路
2021-11-02
Java
Java筆記：Lambda表示式
2024-03-03
Java筆記
Java 基礎 —— Lambda 表示式
2020-07-08
Java
Java8-Lambda表示式
2020-12-29
Java
Android Studio中如何支援使用Lambda表示式
2018-04-20
Android
正規表示式在Java中的使用
2019-04-18
Java
Java中的函數語言程式設計（三）lambda表示式
2021-10-22
Java函數程式設計
lambda 表示式使用的方式
2020-02-10
數串排序關鍵詞 sorted lambda表示式
2018-05-16
排序
Java8的Lambda表示式
2019-03-30
Java
java8特性-lambda表示式
2024-03-09
Java
利用Lambda表示式進行Java中的惰性求值
2018-08-28
Java
利用 Lambda 表示式實現 Java 中的惰性求值
2021-09-09
Java
詞語詞頻統計
2020-11-19
詞頻統計
2024-06-26
lambda 表示式
2024-09-21
lambda表示式
2024-08-15
《Java 8 in Action》Chapter 3：Lambda表示式
2019-03-14
JavaAPT
Java 8新特性（一）：Lambda表示式
2019-03-04
Java
Java 8 lambda 表示式10個示例
2018-03-30
Java
Java入門：Lambda常用表示式解析
2022-05-31
Java
Java 函數語言程式設計（二）Lambda表示式
2018-08-16
Java函數程式設計
Java8特性詳解 lambda表示式（一）：使用篇
2021-12-13
Java

在Java中使用Lambda表示式統計詞頻

在Java中使用Lambda表示式統計詞頻

常規方法

使用Lambda表示式

相關文章