做大資料分析的怎麼可以不會這個?

上海小小胖發表於2019-04-03

在這裡插入圖片描述
Overview: 0 引言 1 環境 2 模組準備 3 實現思路 4 小試牛刀 5 中試牛刀 6 總結

0 引言

詞雲圖,也叫文字雲,是對文字中出現頻率較高的“關鍵詞”予以視覺化的展現,詞雲圖過濾掉大量的低頻低質的文字資訊,使得瀏覽者只要一眼掃過文字就可領略文章的主旨。

1 環境

作業系統:Windows

Python版本:3.7.2

2 模組準備

本文涉及到的Python第三方模組,共計四個:分詞模組jieba,文字雲模組wordcloud,畫圖模組matplotlib,用來處理背景圖片的模組scipy。這些模組均可通過pip方式進行安裝:

在這裡插入圖片描述

模組的匯入:

在這裡插入圖片描述

3 實現思路

準備好一份自己需要分析的文字材料,這裡選用的是19年兩會新鮮出爐的政府工作報告。我們首先得通過jieba模組對文字材料進行分詞處理,然後對處理後的材料使用wordcloud文字雲模組生成相應的詞雲圖片即可。

當然了你可以選擇一個背景圖片,並以此為基礎生成特定的雲圖,這時就用到了上面提到的另外兩個模組scipy和matplotlib。

好了,思路有了,那就開始實踐吧~

4 小試牛刀

小試牛刀章節教你僅用9行程式碼,來生成一個詞雲圖,先欣賞下最終的效果圖。

4.1 效果圖

在這裡插入圖片描述

4.2 程式碼實現

製作雲圖的思路,上文已作說明,這些就不再贅述了,直接看程式碼,程式碼中已新增詳細註釋說明。

在這裡插入圖片描述
除去註釋、匯入模組佔用的兩行,剩下僅7行的程式碼,你來說說Python強大不?

小試牛刀不夠牛?上面做出的雲圖不夠完美?那就繼續看下去,這裡來實現一個定製圖案的雲圖。

5 中試牛刀

我們這裡有一張祖國地圖,是否可以定製生成一個祖國版圖樣式的詞雲圖呢?

在這裡插入圖片描述
答案是肯定的,只因為Python太強大,實現思路直接看程式碼。

5.1 程式碼實現

在這裡插入圖片描述
在這裡插入圖片描述

5.2 效果圖

在這裡插入圖片描述

6 總結

是不是又被強大的Python給震撼了?如引言所述,通過生成詞雲圖,對文章中出現頻率較高的“關鍵詞”予以視覺化的展現,幫助讀者快速領略文章的主旨,既方便又高效!

不過呢,不要高興地太早,這裡給大家暗暗地埋了幾顆雷,詞雲圖功能強大實用自不必說,但是若想正常的用起來,除了上面提到的在安裝wordcloud模組時會遇到麻煩之外,還有更多的麻煩在等著大家。請關注後續Python排錯集的系列文章。

關注公眾號「Python專欄」,後臺回覆:zsxq09,獲取本文全套程式碼

Python專欄二維碼

相關文章