【python技能】詞頻統計
import jieba from astropy.table.np_utils import join import os import sys import jieba.posseg as pseg def main(): #分詞結果儲存列表 word_list = [] #詞頻統計詞典{關鍵詞:次數} word_dict = {} current_dir = os.path.abspath('.') #自定義詞典檔案last檔案 dict_file = os.path.join(current_dir, 'last.txt') jieba.load_userdict(dict_file) #待分詞的檔案 file_name = os.path.join(current_dir, 'cutTest.txt') f = open(file_name, encoding="UTF8") line = f.readline() #分詞之後寫入result檔案 file_name2 = os.path.join(current_dir, 'result.txt') f2 = open(file_name2, 'w', encoding='utf8') while line: seg_list = jieba.cut(line, cut_all=False) #jieba.add_word("有價值資訊", freq=None, tag=None) seg_list = " ".join(seg_list) word_list.extend(seg_list.split(" ")) seg_list.encode("utf8") f2.write(seg_list) f2.write("\n") line = f.readline() f2.close() f.close() for item in word_list: if item not in word_dict: word_dict[item] = 1 else: word_dict[item] += 1 for k, v in word_dict.items(): print(k, v) print("end") if __name__ == '__main__': main()
相關文章
- python如何統計詞頻Python
- python實現詞頻統計Python
- 詞語詞頻統計
- 詞頻統計
- 詞頻統計mapreduce
- Python統計四六級考試的詞頻Python
- Java、Scala、Python ☞ 本地WordCount詞頻統計對比JavaPython
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- python 計算txt文字詞頻率Python
- 用Python如何統計文字檔案中的詞頻?(Python練習)Python
- PostgreSQL全文檢索-詞頻統計SQL
- 文字挖掘之語料庫、分詞、詞頻統計分詞
- 詞頻統計任務程式設計實踐程式設計
- python 實現中文分詞統計Python中文分詞
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 統計英文名著中單詞出現頻率
- python做頻率統計圖 完整版Python
- Python視覺化-generate_from_frequencies給定詞頻畫詞雲圖(WordCloud)Python視覺化Cloud
- LeetCode題解(0692):前K個高頻單詞(Python)LeetCodePython
- 【csp202403-1】詞頻統計【第33次CCF計算機軟體能力認證】計算機
- 熱詞統計分析
- 基於RDD的Spark應用程式開發案列講解(詞頻統計)Spark
- python技能--物件導向程式設計Python物件程式設計
- python統計英文文字中的迴文單詞數Python
- sqoop進行將Hive 詞頻統計的結果資料傳輸到Mysql中OOPHiveMySql
- zzulioj:1133:單詞個數統計(python)我有點皮!!嘿嘿Python
- Python實踐之合併WOS文獻資料,並對關鍵詞進行詞頻分析Python
- Openwrt——頻寬統計助手nlbwmon
- Python技能樹Python
- C++ 統計單詞數C++
- 遊戲中的技能系統設計遊戲
- Trie樹:字串頻率統計排序字串排序
- Java 多執行緒讀取檔案並統計詞頻 例項 出神入化的《ThreadPoolExecutor》Java執行緒thread
- Python分析36套四級真題獲取詞頻最高5000個詞彙,還怕四級不過麼Python
- 【爬蟲+情感判定+Top10高頻詞+詞雲圖】"王心凌"熱門彈幕python輿情分析爬蟲Python
- 【爬蟲+情感判定+Top10高頻詞+詞雲圖】“劉畊巨集“熱門彈幕python輿情分析爬蟲Python
- 【爬蟲+情感判定+Top10高頻詞+詞雲圖】“谷愛凌”熱門彈幕python輿情分析爬蟲Python
- 已知詞頻生成詞雲圖(資料庫到生成詞雲)--generate_from_frequencies(WordCloud)資料庫Cloud
- 瓦爾登湖單詞統計+排序排序