前言
我們都知道python上的一款視覺化工具matplotlib,而前些陣子做一個Spark專案的時候用到了百度開源的一個視覺化JS工具-Echarts,視覺化型別非常多,但是得透過匯入js庫在Java Web專案上執行,平時用Python比較多,於是就在想有沒有Python與Echarts結合的輪子。Google後,找到一個國人開發的一個Echarts與Python結合的輪子:pyecharts,下面就來簡述下pyecharts一些使用細則:
安裝
寫這篇文章用的是Win環境,首先開啟命令列(win+R),輸入:
pip install pyecharts
但筆者實測時發現,由於牆的原因,下載時會出現斷線和速度過慢的問題導致下載失敗,所以建議透過清華映象來進行下載:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyecharts
出現上方的資訊,即代表下載成功,我們可以來進行下一步的實驗了!
使用例項
使用之前我們要強調一點:就是python2.x和python3.x的編碼問題,在python3.x中你可以把它看做預設是unicode編碼,但在python2.x中並不是預設的,原因就在它的bytes物件定義的混亂,而pycharts是使用unicode編碼來處理字串和檔案的,所以當你使用的是python2.x時,請務必在上方插入此程式碼:
from __future__ import unicode_literals
現在我們來開始正式使用pycharts,這裡我們直接使用官方的資料:
柱狀圖-Bar
//匯入柱狀圖-Bar from pyecharts import Bar //設定行名 columns = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"] //設定資料 data1 = [2.0, 4.9, 7.0, 23.2, 25.6, 76.7, 135.6, 162.2, 32.6, 20.0, 6.4, 3.3] data2 = [2.6, 5.9, 9.0, 26.4, 28.7, 70.7, 175.6, 182.2, 48.7, 18.8, 6.0, 2.3] //設定柱狀圖的主標題與副標題 bar = Bar("柱狀圖", "一年的降水量與蒸發量") //新增柱狀圖的資料及配置項 bar.add("降水量", columns, data1, mark_line=["average"], mark_point=["max", "min"]) bar.add("蒸發量", columns, data2, mark_line=["average"], mark_point=["max", "min"]) //生成本地檔案(預設為.html檔案) bar.render()
執行結果如下:
簡單的幾行程式碼就可以將資料進行非常好看的視覺化,而且還是動態的,在這裡還是要安利一下jupyter,pyecharts在v0.1.9.2版本開始,在jupyter上直接呼叫例項(例如上方直接呼叫bar)就可以將圖表直接表示出來,非常方便。
筆者數了數,目前pyecharts上的圖表大概支援到二十多種,接下來,我們再用上方的資料來生成幾個資料探勘常用的圖表示例:
餅圖-Pie
//匯入餅圖Pie from pyecharts import Pie //設定主標題與副標題,標題設定居中,設定寬度為900 pie = Pie("餅狀圖", "一年的降水量與蒸發量",title_pos='center',width=900) //加入資料,設定座標位置為【25,50】,上方的colums選項取消顯示 pie.add("降水量", columns, data1 ,center=[25,50],is_legend_show=False) //加入資料,設定座標位置為【75,50】,上方的colums選項取消顯示,顯示label標籤 pie.add("蒸發量", columns, data2 ,center=[75,50],is_legend_show=False,is_label_show=True) //儲存圖表 pie.render()
箱體圖-Boxplot
//匯入箱型圖Boxplot from pyecharts import Boxplot boxplot = Boxplot("箱形圖", "一年的降水量與蒸發量") x_axis = ['降水量','蒸發量'] y_axis = [data1,data2] //prepare_data方法可以將資料轉為巢狀的 [min, Q1, median (or Q2), Q3, max] yaxis = boxplot.prepare_data(y_axis) boxplot.add("天氣統計", x_axis, _yaxis) boxplot.render()
折線圖-Line
from pyecharts import Line line = Line("折線圖","一年的降水量與蒸發量") //is_label_show是設定上方資料是否顯示 line.add("降水量", columns, data1, is_label_show=True) line.add("蒸發量", columns, data2, is_label_show=True) line.render()
雷達圖-Rader
from pyecharts import Radar radar = Radar("雷達圖", "一年的降水量與蒸發量") //由於雷達圖傳入的資料得為多維資料,所以這裡需要做一下處理 radar_data1 = [[2.0, 4.9, 7.0, 23.2, 25.6, 76.7, 135.6, 162.2, 32.6, 20.0, 6.4, 3.3]] radar_data2 = [[2.6, 5.9, 9.0, 26.4, 28.7, 70.7, 175.6, 182.2, 48.7, 18.8, 6.0, 2.3]] //設定column的最大值,為了雷達圖更為直觀,這裡的月份最大值設定有所不同 schema = [ ("Jan", 5), ("Feb",10), ("Mar", 10), ("Apr", 50), ("May", 50), ("Jun", 200), ("Jul", 200), ("Aug", 200), ("Sep", 50), ("Oct", 50), ("Nov", 10), ("Dec", 5) ] //傳入座標 radar.config(schema) radar.add("降水量",radar_data1) //一般預設為同一種顏色,這裡為了便於區分,需要設定item的顏色 radar.add("蒸發量",radar_data2,item_color="#1C86EE") radar.render()
散點圖-scatter
from pyecharts import Scatter scatter = Scatter("散點圖", "一年的降水量與蒸發量") //xais_name是設定橫座標名稱,這裡由於顯示問題,還需要將y軸名稱與y軸的距離進行設定 scatter.add("降水量與蒸發量的散點分佈", data1,data2,xaxis_name="降水量",yaxis_name="蒸發量", yaxis_name_gap=40) scatter.render()
圖表佈局 Grid
由於標題與圖表是屬於兩個不同的控制元件,所以這裡必須對下方的圖表Line進行標題位置設定,否則會出現標題重疊的bug。
from pyecharts import Grid //設定折線圖示題位置 line = Line("折線圖","一年的降水量與蒸發量",title_top="45%") line.add("降水量", columns, data1, is_label_show=True) line.add("蒸發量", columns, data2, is_label_show=True) grid = Grid() //設定兩個圖表的相對位置 grid.add(bar, grid_bottom="60%") grid.add(line, grid_top="60%") grid.render()
兩圖結合 Overlap
from pyecharts import Overlap overlap = Overlap() bar = Bar("柱狀圖-折線圖合併", "一年的降水量與蒸發量") bar.add("降水量", columns, data1, mark_point=["max", "min"]) bar.add("蒸發量", columns, data2, mark_point=["max", "min"]) overlap.add(bar) overlap.add(line) overlap.render()
總結
- 匯入相關圖表包
- 進行圖表的基礎設定,建立圖表物件
- 利用add()方法進行資料輸入與圖表設定(可以使用print_echarts_options()來輸出所有可配置項)
- 利用render()方法來進行圖表儲存
pyecharts還有許多好玩的3D圖表和地圖圖表,個人覺得地圖圖表是最好玩的,各位有興趣可以去pyecharts的使用手冊檢視,有中文版的非常方便:pyecharts
參考資料:
pyecharts使用手冊:http://pyecharts.org/#/?id=pyecharts
才學疏淺,歡迎評論指導
歡迎前往我的個人小站:www.wengjj.ink