【python技能】詞頻統計

macb007發表於2017-07-30

import jieba
from astropy.table.np_utils import  join
import os
import sys
import jieba.posseg as pseg


def main():
    #分詞結果儲存列表
    word_list = []
    #詞頻統計詞典{關鍵詞：次數}
    word_dict = {}

    current_dir = os.path.abspath('.')
    #自定義詞典檔案last檔案
    dict_file = os.path.join(current_dir, 'last.txt')
    jieba.load_userdict(dict_file)
    #待分詞的檔案
    file_name = os.path.join(current_dir, 'cutTest.txt')
    f = open(file_name, encoding="UTF8")
    line = f.readline()
    #分詞之後寫入result檔案
    file_name2 = os.path.join(current_dir, 'result.txt')
    f2 = open(file_name2, 'w', encoding='utf8')
    while line:
        seg_list = jieba.cut(line, cut_all=False)
        #jieba.add_word("有價值資訊", freq=None, tag=None)
        seg_list = " ".join(seg_list)
        word_list.extend(seg_list.split(" "))
        seg_list.encode("utf8")
        f2.write(seg_list)
        f2.write("\n")
        line = f.readline()
    f2.close()
    f.close()
    for item in word_list:
        if item not in word_dict:
            word_dict[item] = 1
        else:
            word_dict[item] += 1
    for k, v in word_dict.items():
        print(k, v)

    print("end")


if __name__ == '__main__':
    main()

python如何統計詞頻
2021-09-11
Python
python實現詞頻統計
2020-12-08
Python
詞語詞頻統計
2020-11-19
詞頻統計
2024-06-26
詞頻統計mapreduce
2024-10-27
Python統計四六級考試的詞頻
2018-09-10
Python
Java、Scala、Python ☞ 本地WordCount詞頻統計對比
2018-09-06
JavaPython
python TK庫統計word文件單詞詞頻程式 UI選擇文件
2020-12-27
PythonUI
python 計算txt文字詞頻率
2018-07-29
Python
用Python如何統計文字檔案中的詞頻？(Python練習)
2019-11-26
Python
PostgreSQL全文檢索-詞頻統計
2018-04-18
SQL
文字挖掘之語料庫、分詞、詞頻統計
2024-05-20
分詞
詞頻統計任務程式設計實踐
2024-10-14
程式設計
python 實現中文分詞統計
2019-02-16
Python中文分詞
Javafx-【直方圖】文字頻次統計工具中文/英文單詞統計
2021-11-09
Java直方圖
統計英文名著中單詞出現頻率
2018-06-03
python做頻率統計圖完整版
2021-10-21
Python
Python視覺化-generate_from_frequencies給定詞頻畫詞雲圖（WordCloud）
2018-04-24
Python視覺化Cloud
LeetCode題解(0692)：前K個高頻單詞(Python)
2020-11-20
LeetCodePython
【csp202403-1】詞頻統計【第33次CCF計算機軟體能力認證】
2024-05-25
計算機
熱詞統計分析
2020-11-11
基於RDD的Spark應用程式開發案列講解（詞頻統計）
2020-11-12
Spark
python技能--物件導向程式設計
2018-08-11
Python物件程式設計
python統計英文文字中的迴文單詞數
2020-05-13
Python
sqoop進行將Hive 詞頻統計的結果資料傳輸到Mysql中
2020-12-12
OOPHiveMySql
zzulioj:1133:單詞個數統計(python)我有點皮！！嘿嘿
2020-12-17
Python
Python實踐之合併WOS文獻資料，並對關鍵詞進行詞頻分析
2021-03-09
Python
Openwrt——頻寬統計助手nlbwmon
2024-03-20
Python技能樹
2022-04-07
Python
C++ 統計單詞數
2024-09-10
C++
遊戲中的技能系統設計
2019-10-17
遊戲
Trie樹：字串頻率統計排序
2021-09-09
字串排序
Java 多執行緒讀取檔案並統計詞頻例項出神入化的《ThreadPoolExecutor》
2021-01-18
Java執行緒thread
Python分析36套四級真題獲取詞頻最高5000個詞彙，還怕四級不過麼
2018-12-15
Python
【爬蟲+情感判定+Top10高頻詞+詞雲圖】"王心凌"熱門彈幕python輿情分析
2022-06-06
爬蟲Python
【爬蟲+情感判定+Top10高頻詞+詞雲圖】“劉畊巨集“熱門彈幕python輿情分析
2022-05-10
爬蟲Python
【爬蟲+情感判定+Top10高頻詞+詞雲圖】“谷愛凌”熱門彈幕python輿情分析
2022-05-08
爬蟲Python
已知詞頻生成詞雲圖（資料庫到生成詞雲）--generate_from_frequencies（WordCloud）
2019-08-06
資料庫Cloud
瓦爾登湖單詞統計+排序
2020-11-15
排序

【python技能】詞頻統計

相關文章