如何用python建立詞雲圖片
Python實現詞雲的庫有很多,較為常見的就是wordcloud,這個庫基於PIL,PIL是必不可少的,需要用的還有matplotlib和numpy。
本文使用直譯器為python2.7.13 32位。
安裝
pip install wordcloud
使用
針對庫示例做了一個簡單修改,直接使用generate_from_frequencies方法,而沒有使用generate()方法。有這樣幾個原因,generate_from_frequencies是基礎的方法,generate()仍然還是要呼叫generate_from_frequencies方法;實驗比較直接。
庫的使用方法很簡單,但是中文使用的話會有幾個問題,一個是字元編碼問題,二是字型問題,預設的字型不支援中文,因此需要加入font_path = "simfang.ttf"指定字型,這是把字型指定為同一個資料夾下的simfang.ttf。
示例:
#encoding=utf-8 from os import path from wordcloud import WordCloud import sys reload(sys) sys.setdefaultencoding('utf-8') fre={"哈哈".decode('utf-8'): 1.2,"呵呵".decode('utf-8'):6} wordcloud = WordCloud(font_path = "simfang.ttf").generate_from_frequencies(fre) import matplotlib.pyplot as plt plt.imshow(wordcloud, interpolation='bilinear') plt.axis("off") plt.show()
效果如下:
先抽取網頁的文字,然後再進行分詞,將分詞結果根據頻率作為字典傳給generate_from_frequencies,生成詞雲。
更簡單,比如直接抽取文章的關鍵詞,比如部落格每篇文章就有關鍵詞,用Counter庫,直接生成頻率呼叫。
使用背景圖片生成詞雲
對上面的程式碼做了一點簡單的改動:
#encoding=utf-8 from os import path from wordcloud import WordCloud import sys reload(sys) sys.setdefaultencoding('utf-8') d = path.dirname(__file__) text = open(path.join(d, 'constitution.txt')).read().decode('utf-8') import numpy as np from PIL import Image football = np.array(Image.open(path.join(d, "timg.jpg"))) fre={"哈哈".decode('utf-8'): 1.2,"呵呵".decode('utf-8'):6,"咯咯".decode('utf-8'):6, "呵呵".decode('utf-8'):6,"咯咯".decode('utf-8'):6, "啦啦".decode('utf-8'):1,"哦哦".decode('utf-8'):6, "恩恩".decode('utf-8'):3,"呃呃".decode('utf-8'):6, "餓餓".decode('utf-8'):3,"嗯嗯".decode('utf-8'):6, "哼哼".decode('utf-8'):5,"麗麗".decode('utf-8'):6, "咔咔".decode('utf-8'):7,"咳咳".decode('utf-8'):6, "樂樂".decode('utf-8'):6,"吶吶".decode('utf-8'):6, "嘎嘎".decode('utf-8'):6,"嘻嘻".decode('utf-8'):6} #wordcloud = WordCloud(font_path = "simfang.ttf").generate(text) wordcloud = WordCloud(font_path = "simfang.ttf",mask=football).generate_from_frequencies(fre) import matplotlib.pyplot as plt plt.imshow(wordcloud, interpolation='bilinear') plt.axis("off") plt.show()
效果如下:
更多技術請關注。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/1834/viewspace-2834011/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 如何用Python做詞雲?Python
- python分詞和生成詞雲圖Python分詞
- python讀取txt文字資料進行分詞並生成詞雲圖片Python分詞
- 如何用Python 製作詞雲-對1000首古詩做詞雲分析Python
- Python pyecharts繪製詞雲圖PythonEcharts
- 如何用Python做詞雲?(基礎篇視訊教程)Python
- Python文字處理NLP:分詞與詞雲圖Python分詞
- 一步一步教你如何用Python做詞雲Python
- 如何用Python做中文分詞?Python中文分詞
- 如何用Python提取中文關鍵詞?Python
- 如何用Python和深度神經網路尋找近似圖片?Python神經網路
- Python 詞雲系列Python
- js 建立圖片物件JS物件
- 2019最新Python學習路線圖:如何用Python建立微信機器人Python機器人
- 微信小程式裡如何用阿里雲上傳視訊圖片微信小程式阿里
- 阿里雲內容安全介面 敏感詞 green scan、圖片 image scan阿里
- Python 在Word中建立表格並填入資料、圖片Python
- 如何用Python建立自己的Dino Run?Python
- Shift+Click,編輯[...],如編輯圖片
- Python自定義詞雲圖形狀和文字顏色Python
- 如何用Python爬蟲實現百度圖片自動下載?Python爬蟲
- Python視覺化-generate_from_frequencies給定詞頻畫詞雲圖(WordCloud)Python視覺化Cloud
- python -wordcloudan雲詞安裝PythonCloud
- 如何用Python從PDF檔案中提取文字詞彙Python
- 【python】圖片插入文字Python
- Python 下載圖片Python
- Python批次裁剪圖片Python
- 如何用Python做三階拼圖?Python
- python批量ppt轉圖片,pdf轉圖片,word轉圖片指令碼Python指令碼
- 已知詞頻生成詞雲圖(資料庫到生成詞雲)--generate_from_frequencies(WordCloud)資料庫Cloud
- 如何用python建立最簡單的伺服器Python伺服器
- 如何用Python讀取xml檔案後,裁剪標註圖片和擴容資料PythonXML
- python多工抓取圖片Python
- Python批量處理圖片Python
- Python《回車桌面圖片》Python
- Python如何生成詞雲(詳細分析)Python
- 教你如何製作好看的詞雲圖
- python 讀圖片效能測試Python