Python matplotlib繪製散點圖

Python碎片發表於2020-11-03

Python matplotlib繪製散點圖

上篇文章介紹了使用matplotlib繪製折線圖,參考:https://blog.csdn.net/weixin_43790276/article/details/109191533,本片文章繼續介紹使用matplotlib繪製散點圖。

一、matplotlib繪製散點圖

# coding=utf-8
import matplotlib.pyplot as plt


years = [2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
turnovers = [0.5, 9.36, 52, 191, 350, 571, 912, 1027, 1682, 2135, 2684]
plt.figure(figsize=(10, 10), dpi=100)
plt.scatter(years, turnovers)
plt.show()

執行結果:

scatter(): matplotlib中繪製散點圖的函式。可以傳入很多引數,一般傳入兩個列表,分別是散點圖中的x值和y值。上面的例子中使用2009年至2019年這十一年天貓雙11的總成交額資料。

散點圖根據提供的兩組資料,構成圖形中的多個座標點。根據座標點的分佈,分析兩變數之間是否存在某種關聯或總結座標點的分佈趨勢,用於預測資料的走勢。

上面的程式碼已經實現了簡單的散點圖,但只把點繪製出來了,很多資訊都不完整,所以需要進行優化。

二、matplotlib優化散點圖

import matplotlib.pyplot as plt


years = [2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
turnovers = [0.5, 9.36, 52, 191, 350, 571, 912, 1027, 1682, 2135, 2684]
plt.figure(figsize=(10, 15), dpi=100)
plt.scatter(years, turnovers, c='red', s=100, label='成交額')
plt.xticks(range(2008, 2020, 1))
plt.yticks(range(0, 3200, 200))
plt.xlabel("年份", fontdict={'size': 16})
plt.ylabel("成交額", fontdict={'size': 16})
plt.title("歷年天貓雙11總成交額", fontdict={'size': 20})
plt.legend(loc='best')
plt.show()

執行結果:

在第一次繪製的散點圖中,已經看出了點的大概分佈情況,所以在使用figure()函式建立影像時,可以修改figsize引數調整影像尺寸,設定更好的影像比例。

在呼叫scatter()函式繪製散點圖時,使用c='顏色'來設定點的顏色,使用s='大小'來設定點的大小,並設定label用於圖例展示。

第一次的散點圖中,x軸上沒有顯示所有的年份刻度,最後一個點已經分佈到了圖形的右上角,所以使用xticks()和yticks()來設定x軸和y軸的刻度標籤和範圍。

使用xlabel()和ylabel()設定x軸和y軸的標籤,說明x軸和y軸的含義。使用title()設定散點圖的標題,說明散點圖展示的資料。使用legend()將圖例展示出來。

這樣一張基本功能完整,資訊完整的散點圖就完成了。

三、matplotlib散點圖區分點的顏色和大小

import matplotlib.pyplot as plt
import numpy as np


years = [2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
turnovers = [0.5, 9.36, 52, 191, 350, 571, 912, 1027, 1682, 2135, 2684]
plt.figure(figsize=(10, 15), dpi=100)
size = list()
for tur in turnovers:
    size.append(tur) if tur > 100 else size.append(100)
plt.xticks(range(2008, 2020, 1))
plt.yticks(range(0, 3200, 200))
plt.scatter(years, turnovers, c=np.random.randint(0, 50, 11), s=size)
plt.xlabel("年份", fontdict={'size': 16})
plt.ylabel("成交額", fontdict={'size': 16})
plt.title("歷年天貓雙11總成交額", fontdict={'size': 20})
plt.show()

執行結果:

上一張散點圖中已經對資料作了基本的展示,為了使資料展示效果更好,可以對散點圖進行美化。

資料是歷年雙11的總成交額,每年的資料是獨立的,可以用不同的顏色來區分。這裡使用numpy中的random.randint()隨機生成11個值,將這11個隨機的值傳給scatter()函式中的c引數,使每一個點的顏色不一樣,可以更好地表示每個點的獨立性。

pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple

成交額是逐年變化的,為了從散點圖中體現出大小的差異,可以根據成交額的大小設定點的大小。這裡直接將成交額作為點的大小(成交額很小的設定一個值,圖形中的點不小於這個值),得到由11個值組成的列表,傳給scatter()函式中的s引數,可以體現每個點的大小差異(成交額越大點越大)。

四、matplotlib散點圖的趨勢簡單分析

import matplotlib.pyplot as plt
import numpy as np
import math


years = [2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019]
turnovers = [0.5, 9.36, 52, 191, 350, 571, 912, 1027, 1682, 2135, 2684]
squares = [math.pow(year-2008, 3.3) for year in years]
powers = [math.pow(2, year-2008) for year in years]
plt.figure(figsize=(10, 15), dpi=100)
size = list()
for tur in turnovers:
    size.append(tur) if tur > 100 else size.append(100)
plt.xticks(range(2008, 2020, 1))
plt.yticks(range(0, 3200, 200))
plt.scatter(years, turnovers, c=np.random.randint(0, 50, 11), s=size, label='成交額')
plt.plot(years, squares, color='red', label='x^3.4')
plt.plot(years, powers, color='blue', label='2^n')
plt.legend(loc='best', fontsize=16, markerscale=0.5)
plt.xlabel("年份", fontdict={'size': 16})
plt.ylabel("成交額", fontdict={'size': 16})
plt.title("歷年天貓雙11總成交額", fontdict={'size': 20})
plt.show()

執行結果:

散點圖的作用主要是用於分析資料的趨勢,用於預測未來的資料。比如我想預測2020年天貓雙11的總成交額,通過對比的方式,簡單分析一下這個趨勢更接近指數函式還是更接近多次函式。

在散點圖中,我繪製了兩條曲線,y=2^x和y=x^(3.4),一條是2為底的指數函式,一條是x的3.4次方(三次函式ax^3+bx^2+cx+d),可以看到雙11總成交額的變化趨勢更接近三次函式。

這裡我只是簡單對比一下,三次函式還有二次項、一次項和常數項,所以x^(3.4)中的0.4可以通過二次項、一次項和常數項來補充,指數函式的變化趨勢太快,與雙11總成交額的變化趨勢差異很大。這種簡單對比是很粗糙的,只是為了說明散點圖可以用於分析趨勢。真實的分析不能簡單看每年的資料,需要考慮很多因素(甚至因為某個因素的加入,成交額已經快到天花板了,很可能後面會下降)。

 

 

相關文章