Apache Superset 1.2.0教程 (三)—— 圖表功能詳解

獨孤風發表於2021-07-19

通過之前章節的學習,我們已經成功地安裝了superset,並且連線mysql資料庫,視覺化了王者英雄的資料。使用的是最簡單Table型別的圖表,但是superset還支援非常多的圖表型別。

本文我們將對各種圖表型別進行逐一的演示,文章較長,建議收藏後閱讀。

圖表分類

Superset提供了大量的圖表來幫助我們進行資料視覺化。

對於圖表的型別可以分為以下幾類:

  • 時間序列圖表:這類圖表顯示隨時間變化的資料,最適合用於發現變化趨勢。時間序列圖的示例包括折線圖、時間序列條形圖等等。
  • 組合圖:這些型別的圖表顯示了資料在特定領域的分佈情況,例如“最多...”、“最少...”和“前 10 名”型別的圖表. 組合圖的示例包括條形圖、餅圖和樹狀圖。
  • 分佈圖:這類圖表顯示資料如何分佈在一個或多個欄位中,最適合用於具有多維屬性的資料。分佈圖的示例包括直方圖、箱線圖和水平圖。
  • 關係圖:這類圖表顯示兩個或多個變數之間的關係,通常用於傳達共性、非共性或因果關係型別。關係圖的示例包括資料透視表、熱圖和氣泡圖。
  • 地理空間圖表:這類圖表顯示基於地理的資料。superset還提供了各種基於deck.gl 的地理空間圖表。

只有選擇了正確的圖表,才能準確的傳達出你想表達的意思。那麼怎麼確定圖表型別呢?

首先要考慮的就是想要實現的目標,一張好的圖表必須是能夠清楚表達問題的答案。以下是一些選表準則,供參考:

  • 當您想要顯示資料如何隨時間變化(例如,上一季度產品銷售的變化)時,請使用時間序列圖表
  • 當您的資料側重於單個因素(例如,畢業生數量、最受歡迎的城市等)時,請使用組合圖
  • 當您的資料被分配到不同的類別時使用分佈圖(例如,某個區間段的人數分佈等)。
  • 當您在兩個或多個值之間進行比較時使用關係圖(例如,與溫度變化相比,海平面上升)。
  • 當您的資料依賴於地理(例如,城市的人口密度、空中交通路線等)時,請使用地理空間圖表

資料集準備

針對這些圖表,準備了不同的資料集進行視覺化操作。分別是:

時間序列圖表 : “大喬” 關鍵詞,近一個月搜尋指數變化資料。

組合圖:王者各英雄最大生命值的排名情況。

分佈圖:王者各英雄最大生命值,每個生命值區間段的英雄數量統計。

關係圖:看一下最大物防與最大生命的關係。

地理空間圖表:這裡簡單對美國和印度新冠確診人數做一個視覺化。

下面來具體講解不同型別圖表的用法:

一、時間序列圖表

首先準備好資料。資料來源於大喬的搜尋指數資料。

首先進入Datasets頁面,將這張表加入。

表成功加入以後,進入Charts頁面,新建一個圖表。

選擇圖表型別為 Time-series Bar Chart

新建圖表

進入圖表設定頁,在這裡可以對圖表進行一系列的設定,首先修改名稱。

預設表的統計指標是COUNT,這裡改成SUM。

修改時間範圍,預設是LAST WEEK。

還可以做一些自定義的設定,顏色,座標軸等等。

儲存,這樣,時間序列圖表就成功完成了。

二、組合圖表

此資料來源使用王者英雄資料,之前已經關聯。下面我們用此資料製作一個餅圖。

首先還是新建一個圖表,選擇型別為 Pie Chart

選擇好資料來源

進行基本的設定,這裡按英雄分組,統計維度為最大生命

做一些自定義的設定

點選RUN查詢,這樣餅圖就做好了。

三、分佈圖表

依然使用王者英雄資料,做一個直方圖

首先新建圖表,選擇圖表型別為 Histogram

進行一些自定義設定

選擇統計列為 最大生命,調整好間隔。

可以清楚的看到最大生命值的分佈情況。

點選RUN查詢,這樣直方圖就做好了,儲存。

四、關係圖表

依然使用已有資料

選擇Heatmap型別圖表

隨後做一些基本的設定,X軸選擇最大物防

Y軸選擇最大生命。

點選RUN查詢,這樣熱力圖就做好了,儲存。

五、地理空間圖表

準備好資料,選擇圖表型別為 World Map

進行一些設定,國家程式碼,統計列等等。

點選RUN進行查詢,儲存。

通過本文,我們已經對superset中的各種圖表有了一個基本的瞭解。superset還有哪些功能呢?下一章繼續~

相關文章