對文字檔案中的單詞統計出現的次數(即詞頻)並按詞頻的從高到低排序
//業務需求:求給定words.txt中的相同單詞出現的次數(即詞頻),並按照單詞出現次數的從高到低排序!(原文字檔案中只有單詞和空格,且全為小寫)
//關鍵詞 IO流 HashMap ArrayList
//業務分析:1.讀入檔案,拿到內容;2.解析檔案,進行切分;3.將每個單詞放入集合;4.統計出現次數並排序
程式碼如下:
public class Test33 {
public static void main(String[] args) throws Exception {
//讀檔案
try(BufferedReader br = new BufferedReader(new FileReader("D:/words.txt"))){
HashMap<String, Integer> map = new HashMap<String, Integer>();//建一個存放讀入資料的集合
String line = null;//每次讀取一行
while((line=br.readLine())!=null){//迴圈讀入
String[] split = line.split(" ");//切分
for(String word : split){//遍歷字串陣列
if(word.length()!=0){//判斷物件不為空
if(map.containsKey(word)){//判斷集合中是否包括目標單詞
map.put(word, map.get(word)+1);//如果包括,value值+1,如果不包括,將新單詞放入集合中
}
else{
map.put(word, 1);
}
}
}
}
Set<Entry<String,Integer>> entrySet = map.entrySet();//集合中的元素以k,v形式取出
ArrayList<Entry<String,Integer>> list = new ArrayList<Entry<String, Integer>>(entrySet);//放入List集合中
Collections.sort(list, new Comparator<Entry<String, Integer>>() {//進行降序排序
@Override//重寫比較器
public int compare(Entry<String, Integer> o1, Entry<String, Integer> o2) {
return o2.getValue().compareTo(o1.getValue());
}
});
System.out.println(list);//列印結果
}
}
}
相關文章
- 瓦爾登湖各單詞出現頻次,並按排次由高到低排序排序
- spark下統計單詞頻次Spark
- 統計檔案中出現的單詞次數
- 呼叫MapReduce對檔案中單詞出現次數進行統計
- **呼叫MapReduce對檔案中各個單詞出現的次數進行統計**
- 詞頻統計
- 文字挖掘之語料庫、分詞、詞頻統計分詞
- 用Python如何統計文字檔案中的詞頻?(Python練習)Python
- 詞頻統計mapreduce
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 分析“詞頻統計“專案程式
- 統計檔案中單詞個數
- python實現詞頻統計Python
- 統計一個字串中的單詞的個數,並列印各個單詞字串
- 詞頻統計-------------web版本Web
- 個人專案----詞頻統計----單元測試
- Java簡單實現漢語詞頻統計Java
- 在Linux中呼叫MapReduce對檔案中各個單詞出現次數進行統計Linux
- python如何統計詞頻Python
- 【python技能】詞頻統計Python
- python 計算txt文字詞頻率Python
- 個人專案----詞頻統計WEB(部分功能)Web
- 個人專案----詞頻統計(補全功能)
- Ospaf專案-commits詞頻統計模組MIT
- pyton 統計單詞並排序-ok排序
- PostgreSQL全文檢索-詞頻統計SQL
- Python統計四六級考試的詞頻Python
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- python統計英文文字中的迴文單詞數Python
- js統計陣列中單詞出現次數程式碼例項JS陣列
- 【week2】 詞頻統計效能分析
- Hadoop MapReduce之wordcount(詞頻統計)Hadoop
- Java、Scala、Python ☞ 本地WordCount詞頻統計對比JavaPython
- 統計知識:頻數表(百度名詞)
- 利用python內建函式,快速統計單詞在文字中出現的次數Python函式
- 單詞小卡片 -- 從單詞、例句收集到命令式背單詞
- 已知詞頻生成詞雲圖(資料庫到生成詞雲)--generate_from_frequencies(WordCloud)資料庫Cloud
- 詞頻統計任務程式設計實踐程式設計