Java簡單實現漢語詞頻統計

flash_love發表於2017-08-11

需求需要一個詞頻統計,先寫了一個簡單的demo,就是先用ArrayList儲存詞語,然後用遍歷用HashMap去儲存數量和詞語。

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import org.junit.Test;

public class TestWordCount {
    @Test
    public void testWordCount(){
        List<String> wordList=new ArrayList<String>();
        wordList.add("我");
        wordList.add("你");
        wordList.add("我");
        wordList.add("他");
        wordList.add("他");
        wordList.add("那個");
        wordList.add("哪個");
        wordList.add("誰");
        System.out.println(wordList);
        Map<String,Integer> amountWord=new HashMap<String,Integer>();
        for (String string : wordList) {
            if(!amountWord.containsKey(string)){
                amountWord.put(string,1);
            }else{
                amountWord.put(string, amountWord.get(string).intValue()+1);
            }
        }
        System.out.println(amountWord);
    }
}

這裡寫圖片描述

相關文章