pyinstaller和wordcloud和jieba的使用案列

L雜貨店發表於2021-10-28

原文網址 : https://www.cnblogs.com/kxsm/p/15475783.html

CloudJieba

一、pyinstaller庫

1、簡介

pyinstaller庫：將指令碼程式轉變為可執行（.exe）格式的第三方庫
注意：需要在.py檔案所在目錄進行以下命令，圖示副檔名是.ico

2、格式：

pyinstaller -F 檔案.py
pyinstaller -i 圖示名.ico 檔名.py

生成後的.exe檔案放在dict資料夾裡

二、wordcloud庫

1、詞雲介紹

詞雲以詞語為基本單元，根據其在文字中出現的頻率設計不同大小一形成視覺上不同的效果，形成關鍵詞雲層或關鍵詞渲染，從而使讀者一眼就可以讀到文字重點。wordcloud的核心是WordCloud類，所有功能都封裝在這個類中，使用時需要先例項化一個WordCloud類的物件，並呼叫。

2、需要安裝的模組

pip install wordcloud
pip install imageio
注意：字型檔案需要指定路徑，或者和檔案放在同一目錄

3、wordcloud常用的函式

WordCloud().generate(文字) 將字串轉化成詞雲
WordCloud().to_file（檔案路徑）將詞雲生成檔案

4、案列

點選檢視程式碼

from wordcloud import WordCloud     #使用WordCloud類
import imageio     
# from scipy.misc import imread  其中imread模組在scipy中已經被棄用，建議使用imageio
mask = imageio.imread('C:/Users/wordcloud/hzw.png') 
#圖片轉換成陣列形式，一般使用png圖片,windows中路徑要麼用/要麼要\\因為一條\代表轉義字元
with open('C:/Users/wordcloud/hzw.txt','r',encoding='utf-8') as f:
    txt = f.read()
    wordcloud = WordCloud(width=1017,\
        height=1097,\
        max_words=400,\
        max_font_size=80,\
        mask=mask,\
        font_path='msyh.ttc',\
            ).generate(txt)      #字串轉化成詞雲
    wordcloud.to_file('C:/Users/wordcloud/xhzw.png')  #詞雲生成檔案

效果展示：

在生成詞雲時，wordcloud預設會以空格或標點為分割符對目標文字進行分詞處理，對於中文文字，分詞處理需要由使用者來完成，可以結合jieba庫一起使用，一般步驟是先將文字分詞處理，然後以空格拼接，再呼叫。
用法：
words = jieba.lcut(txt)#進準分詞
newtxt = ' '.join(words) #空格拼接
結合jieba庫的效果

三、jieba庫

1、簡介

通過中文詞庫的方式來識別分詞的
-- 利用一箇中文詞庫，確定漢字之間的關聯概率
-- 通過計算漢字之間的概率，漢字間概率大的組成片語，形成分詞結果
-- 除了分詞，使用者還可以新增自定義的片語

2、案列

點選檢視程式碼

from posixpath import commonpath
import jieba
with open('C:/Users/hzw.txt','r',encoding='utf-8') as f:
    txt = f.read()
    words = jieba.lcut(txt)
    counts = {}
    bd = ['，','。','、',' ']
    for word in words:
        if word in bd:
            continue           #如果文字中有標點符號，就跳過
        elif len(word)==1:     #表示一個字的次遇到就跳過
            continue
        else:
            counts[word]=counts.get(word,0)+1   #將出現過的次記錄次數並寫進字典
    items = list(counts.items())      #將字典轉成列表
    items.sort(key=lambda x:x[1],reverse=True)  
    #x可以是任意，[]裡面的數表示對第幾個元素排序，reverse=True表示升序，預設是降序
    for i in range(3):  #迴圈三次，只展示排名前三的結果
        word,count=items[i]   #從元組裡取值
        print(f'{word:^5}：{count:<5}')    #^居中對齊，保留5個寬度

效果展示

JB的Python之旅-資料分析篇-jieba&wordcloud(詞雲)
2018-06-12
PythonJiebaCloud
Laravel 中使用 PHP 分詞庫 (jieba) 和 (scws)
2018-06-24
LaravelPHP分詞Jieba
python檔案打包利器之pyinstaller的使用
2019-02-16
Python
Pyinstaller利用spec檔案打包的使用模板
2020-07-07
使用pyinstaller打包exe檔案教程
2019-04-15
pyinstaller 打包 exe 程式步驟和新增依賴檔案方法
2020-12-21
使用PyInstaller打包檔案為exe程式
2024-12-05
命令列技巧：使用 find 和 xargs 查詢和處理檔案
2019-10-17
命令列
python使用jieba實現中文文件分詞和去停用詞
2019-06-19
PythonJieba分詞
Python AI小專案打包通關：Pyinstaller和Wix都用上了
2022-12-27
PythonAI
使用 pyinstaller 打包 py 檔案成 exe 程式
2019-02-16
Golang 陣列和切片 Slice 和 Map 使用
2020-06-04
Golang陣列
GCD之佇列的實現和使用
2021-02-03
GC佇列
使用PyInstaller打包Python程式
2018-11-02
Python
單機最快的佇列Disruptor解析和使用
2023-04-05
佇列
Python：使用pyinstaller打包含有gettext locales語言環境的專案
2022-01-27
Python
如何在命令列中使用 ftp 命令上傳和下載檔案
2021-09-09
命令列FTP
Python 自然語言處理（基於jieba分詞和NLTK）
2018-05-11
Python自然語言處理Jieba分詞
使用 Supervisor 管理 Laravel 佇列和 Horizon
2020-10-27
Laravel佇列
pyinstaller打包exe(32位和64位)和執行太慢等問題解決
2020-10-08
jieba
2024-05-25
Jieba
hanlp和jieba等六大中文分工具的測試對比
2019-02-25
HanLPJieba
pyinstaller打包python成.exe檔案
2020-11-07
Python
Excel中實現當手動輸入A列和B列的值時，C列自動計算A列和B列的和
2024-10-13
Excel
Python：Python 中 jieba 庫的使用（中文分詞）
2018-05-12
PythonJieba中文分詞
Javascript - 陣列和陣列的方法
2019-02-17
JavaScript陣列
shell指令碼字串和陣列的使用操作方法
2020-11-12
指令碼字串陣列
使用lsd 和 exa 來重新想象和設計你的檔案和目錄列表
2022-08-21
python3.6 使用pyinstaller 打包web程式的方法
2018-12-06
PythonWeb
列舉和列舉的取值範圍
2024-07-03
一個JSON字串和檔案處理的命令列神器jq，windows和linux都可用
2018-09-26
JSON字串命令列WindowsLinux
.yaml引數檔案的編寫和使用
2020-12-15
YAML
OSX中隱藏和顯示[隱藏檔案]的命令列
2018-10-20
命令列
如何使用find和xargs查詢和處理檔案
2019-11-17
JavaScript中async和await的使用以及佇列問題
2022-06-27
JavaScriptAI佇列
陣列和字串
2024-08-03
陣列字串
棧和佇列
2024-11-08
佇列
使用 uWSGI 和 Nginx 部署 Django 專案
2019-04-19
NginxDjango

pyinstaller和wordcloud和jieba的使用案列

一、pyinstaller庫

1、簡介

2、格式：

二、wordcloud庫

1、詞雲介紹

2、需要安裝的模組

3、wordcloud常用的函式

4、案列

三、jieba庫

1、簡介

2、案列

相關文章