0 引言
詞雲圖,也叫文字雲,是對文字中出現頻率較高的“關鍵詞”予以視覺化的展現,詞雲圖過濾掉大量的低頻低質的文字資訊,使得瀏覽者只要一眼掃過文字就可領略文章的主旨。
1 環境
作業系統:Windows
Python版本:3.7.2
2 模組準備
本文涉及到的Python第三方模組,共計四個:分詞模組jieba,文字雲模組wordcloud,畫圖模組matplotlib,用來處理背景圖片的模組scipy。這些模組均可通過pip方式進行安裝:
模組的匯入:
3 實現思路
準備好一份自己需要分析的文字材料,這裡選用的是19年兩會新鮮出爐的政府工作報告。我們首先得通過jieba模組對文字材料進行分詞處理,然後對處理後的材料使用wordcloud文字雲模組生成相應的詞雲圖片即可。
當然了你可以選擇一個背景圖片,並以此為基礎生成特定的雲圖,這時就用到了上面提到的另外兩個模組scipy和matplotlib。
好了,思路有了,那就開始實踐吧~
4 小試牛刀
小試牛刀章節教你僅用9行程式碼,來生成一個詞雲圖,先欣賞下最終的效果圖。
4.1 效果圖
4.2 程式碼實現
製作雲圖的思路,上文已作說明,這些就不再贅述了,直接看程式碼,程式碼中已新增詳細註釋說明。
除去註釋、匯入模組佔用的兩行,剩下僅7行的程式碼,你來說說Python強大不?小試牛刀不夠牛?上面做出的雲圖不夠完美?那就繼續看下去,這裡來實現一個定製圖案的雲圖。
5 中試牛刀
我們這裡有一張祖國地圖,是否可以定製生成一個祖國版圖樣式的詞雲圖呢?
答案是肯定的,只因為Python太強大,實現思路直接看程式碼。5.1 程式碼實現
5.2 效果圖
6 總結
是不是又被強大的Python給震撼了?如引言所述,通過生成詞雲圖,對文章中出現頻率較高的“關鍵詞”予以視覺化的展現,幫助讀者快速領略文章的主旨,既方便又高效!
不過呢,不要高興地太早,這裡給大家暗暗地埋了幾顆雷,詞雲圖功能強大實用自不必說,但是若想正常的用起來,除了上面提到的在安裝wordcloud模組時會遇到麻煩之外,還有更多的麻煩在等著大家。請關注後續Python排錯集的系列文章。
關注公眾號「Python專欄」,後臺回覆:zsxq09,獲取本文全套程式碼