Python資料視覺化工具pyecharts使用細則

wengJJ發表於2018-08-16

前言

我們都知道python上的一款視覺化工具matplotlib,而前些陣子做一個Spark專案的時候用到了百度開源的一個視覺化JS工具-Echarts,視覺化型別非常多,但是得透過匯入js庫在Java Web專案上執行,平時用Python比較多,於是就在想有沒有Python與Echarts結合的輪子。Google後,找到一個國人開發的一個Echarts與Python結合的輪子:pyecharts,下面就來簡述下pyecharts一些使用細則:

安裝

寫這篇文章用的是Win環境,首先開啟命令列(win+R),輸入:

pip install pyecharts

但筆者實測時發現,由於牆的原因,下載時會出現斷線和速度過慢的問題導致下載失敗,所以建議透過清華映象來進行下載:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyecharts

出現上方的資訊,即代表下載成功,我們可以來進行下一步的實驗了!

使用例項

使用之前我們要強調一點:就是python2.xpython3.x的編碼問題,在python3.x中你可以把它看做預設是unicode編碼,但在python2.x中並不是預設的,原因就在它的bytes物件定義的混亂,而pycharts是使用unicode編碼來處理字串和檔案的,所以當你使用的是python2.x時,請務必在上方插入此程式碼:

from __future__ import unicode_literals

現在我們來開始正式使用pycharts,這裡我們直接使用官方的資料:

柱狀圖-Bar

//匯入柱狀圖-Bar
from pyecharts import Bar
//設定行名
columns = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]
//設定資料
data1 = [2.0, 4.9, 7.0, 23.2, 25.6, 76.7, 135.6, 162.2, 32.6, 20.0, 6.4, 3.3]
data2 = [2.6, 5.9, 9.0, 26.4, 28.7, 70.7, 175.6, 182.2, 48.7, 18.8, 6.0, 2.3]
//設定柱狀圖的主標題與副標題
bar = Bar("柱狀圖", "一年的降水量與蒸發量")
//新增柱狀圖的資料及配置項
bar.add("降水量", columns, data1, mark_line=["average"], mark_point=["max", "min"])
bar.add("蒸發量", columns, data2, mark_line=["average"], mark_point=["max", "min"])
//生成本地檔案(預設為.html檔案)
bar.render()

執行結果如下:

簡單的幾行程式碼就可以將資料進行非常好看的視覺化,而且還是動態的,在這裡還是要安利一下jupyter,pyecharts在v0.1.9.2版本開始,在jupyter上直接呼叫例項(例如上方直接呼叫bar)就可以將圖表直接表示出來,非常方便。

筆者數了數,目前pyecharts上的圖表大概支援到二十多種,接下來,我們再用上方的資料來生成幾個資料探勘常用的圖表示例:

餅圖-Pie

//匯入餅圖Pie
from pyecharts import Pie
//設定主標題與副標題,標題設定居中,設定寬度為900
pie = Pie("餅狀圖", "一年的降水量與蒸發量",title_pos='center',width=900)
//加入資料,設定座標位置為【25,50】,上方的colums選項取消顯示
pie.add("降水量", columns, data1 ,center=[25,50],is_legend_show=False)
//加入資料,設定座標位置為【75,50】,上方的colums選項取消顯示,顯示label標籤
pie.add("蒸發量", columns, data2 ,center=[75,50],is_legend_show=False,is_label_show=True)
//儲存圖表
pie.render()

 

箱體圖-Boxplot

//匯入箱型圖Boxplot
from pyecharts import Boxplot 
boxplot = Boxplot("箱形圖", "一年的降水量與蒸發量")
x_axis = ['降水量','蒸發量']
y_axis = [data1,data2]
//prepare_data方法可以將資料轉為巢狀的 [min, Q1, median (or Q2), Q3, max]
yaxis = boxplot.prepare_data(y_axis)       
boxplot.add("天氣統計", x_axis, _yaxis)
boxplot.render()

折線圖-Line

from pyecharts import Line
line = Line("折線圖","一年的降水量與蒸發量")
//is_label_show是設定上方資料是否顯示
line.add("降水量", columns, data1, is_label_show=True)
line.add("蒸發量", columns, data2, is_label_show=True)
line.render()

雷達圖-Rader

from pyecharts import Radar
radar = Radar("雷達圖", "一年的降水量與蒸發量")
//由於雷達圖傳入的資料得為多維資料,所以這裡需要做一下處理
radar_data1 = [[2.0, 4.9, 7.0, 23.2, 25.6, 76.7, 135.6, 162.2, 32.6, 20.0, 6.4, 3.3]]
radar_data2 = [[2.6, 5.9, 9.0, 26.4, 28.7, 70.7, 175.6, 182.2, 48.7, 18.8, 6.0, 2.3]]
//設定column的最大值,為了雷達圖更為直觀,這裡的月份最大值設定有所不同
schema = [ 
    ("Jan", 5), ("Feb",10), ("Mar", 10),
    ("Apr", 50), ("May", 50), ("Jun", 200),
    ("Jul", 200), ("Aug", 200), ("Sep", 50),
    ("Oct", 50), ("Nov", 10), ("Dec", 5)
]
//傳入座標
radar.config(schema)
radar.add("降水量",radar_data1)
//一般預設為同一種顏色,這裡為了便於區分,需要設定item的顏色
radar.add("蒸發量",radar_data2,item_color="#1C86EE")
radar.render()

散點圖-scatter

from pyecharts import Scatter
scatter = Scatter("散點圖", "一年的降水量與蒸發量")
//xais_name是設定橫座標名稱,這裡由於顯示問題,還需要將y軸名稱與y軸的距離進行設定
scatter.add("降水量與蒸發量的散點分佈", data1,data2,xaxis_name="降水量",yaxis_name="蒸發量",
            yaxis_name_gap=40)
scatter.render()

圖表佈局 Grid

由於標題與圖表是屬於兩個不同的控制元件,所以這裡必須對下方的圖表Line進行標題位置設定,否則會出現標題重疊的bug。

from pyecharts import Grid
//設定折線圖示題位置
line = Line("折線圖","一年的降水量與蒸發量",title_top="45%")
line.add("降水量", columns, data1, is_label_show=True)
line.add("蒸發量", columns, data2, is_label_show=True)
grid = Grid()
//設定兩個圖表的相對位置
grid.add(bar, grid_bottom="60%")
grid.add(line, grid_top="60%")
grid.render()

兩圖結合 Overlap

from pyecharts import Overlap
overlap = Overlap()
bar = Bar("柱狀圖-折線圖合併", "一年的降水量與蒸發量")
bar.add("降水量", columns, data1, mark_point=["max", "min"])
bar.add("蒸發量", columns, data2, mark_point=["max", "min"])
overlap.add(bar)
overlap.add(line)
overlap.render()

總結

  1. 匯入相關圖表包
  2. 進行圖表的基礎設定,建立圖表物件
  3. 利用add()方法進行資料輸入與圖表設定(可以使用print_echarts_options()來輸出所有可配置項)
  4. 利用render()方法來進行圖表儲存

pyecharts還有許多好玩的3D圖表和地圖圖表,個人覺得地圖圖表是最好玩的,各位有興趣可以去pyecharts的使用手冊檢視,有中文版的非常方便:pyecharts


參考資料:
pyecharts使用手冊:http://pyecharts.org/#/?id=pyecharts

才學疏淺,歡迎評論指導

歡迎前往我的個人小站:www.wengjj.ink

相關文章