【python技能】詞頻統計
import jieba from astropy.table.np_utils import join import os import sys import jieba.posseg as pseg def main(): #分詞結果儲存列表 word_list = [] #詞頻統計詞典{關鍵詞:次數} word_dict = {} current_dir = os.path.abspath('.') #自定義詞典檔案last檔案 dict_file = os.path.join(current_dir, 'last.txt') jieba.load_userdict(dict_file) #待分詞的檔案 file_name = os.path.join(current_dir, 'cutTest.txt') f = open(file_name, encoding="UTF8") line = f.readline() #分詞之後寫入result檔案 file_name2 = os.path.join(current_dir, 'result.txt') f2 = open(file_name2, 'w', encoding='utf8') while line: seg_list = jieba.cut(line, cut_all=False) #jieba.add_word("有價值資訊", freq=None, tag=None) seg_list = " ".join(seg_list) word_list.extend(seg_list.split(" ")) seg_list.encode("utf8") f2.write(seg_list) f2.write("\n") line = f.readline() f2.close() f.close() for item in word_list: if item not in word_dict: word_dict[item] = 1 else: word_dict[item] += 1 for k, v in word_dict.items(): print(k, v) print("end") if __name__ == '__main__': main()
相關文章
- python如何統計詞頻Python
- python實現詞頻統計Python
- 詞頻統計
- 詞頻統計mapreduce
- Python統計四六級考試的詞頻Python
- 詞頻統計-------------web版本Web
- Java、Scala、Python ☞ 本地WordCount詞頻統計對比JavaPython
- python TK庫 統計word文件單詞詞頻程式 UI選擇文件PythonUI
- 分析“詞頻統計“專案程式
- PostgreSQL全文檢索-詞頻統計SQL
- spark下統計單詞頻次Spark
- python 計算txt文字詞頻率Python
- 文字挖掘之語料庫、分詞、詞頻統計分詞
- 【week2】 詞頻統計效能分析
- Hadoop MapReduce之wordcount(詞頻統計)Hadoop
- 用Python如何統計文字檔案中的詞頻?(Python練習)Python
- 詞頻統計任務程式設計實踐程式設計
- 個人專案----詞頻統計WEB(部分功能)Web
- 個人專案----詞頻統計(補全功能)
- Ospaf專案-commits詞頻統計模組MIT
- 個人專案----詞頻統計----單元測試
- 在Java中使用Lambda表示式統計詞頻Java
- Java簡單實現漢語詞頻統計Java
- 統計知識:頻數表(百度名詞)
- Javafx-【直方圖】文字頻次統計工具 中文/英文單詞統計Java直方圖
- 對文字檔案中的單詞統計出現的次數(即詞頻)並按詞頻的從高到低排序排序
- [python] LDA處理文件主題分佈及分詞、詞頻、tfidf計算PythonLDA分詞
- python 實現中文分詞統計Python中文分詞
- python 統計文章單詞個數Python
- 《Cracking the Coding Interview程式設計師面試金典》----詞頻統計View程式設計師面試
- python 統計文章單詞個數-1Python
- python 統計文章單詞個數 -2Python
- python做頻率統計圖 完整版Python
- 【python資料探勘課程】十三.WordCloud詞雲配置過程及詞頻分析PythonCloud
- Python視覺化-generate_from_frequencies給定詞頻畫詞雲圖(WordCloud)Python視覺化Cloud
- 熱詞統計分析
- 基於RDD的Spark應用程式開發案列講解(詞頻統計)Spark
- matlab統計 頻數、頻率和累積頻率Matlab