資料視覺化之美:桑基圖的前世今生

hxc979891發表於2021-12-09

很多時候,我們想透過視覺化資料來展示實體之間流動的情況,例如,讓我們以居民如何在英國境內從一個國家遷移到另一個國家為例,在這裡,看看有多少居民從英格蘭遷移到北愛爾蘭、蘇格蘭和威爾士將是一個有趣的分析。

                                             

從這個桑基圖圖表視覺化中可以明顯看出,從英格蘭遷移到威爾士的居民多於從蘇格蘭或北愛爾蘭遷移的居民,從威爾士遷移到英格蘭的居民多於從蘇格蘭遷移到英格蘭的居民。

 

什麼是桑基圖?

桑基圖通常描繪從一個實體(或節點)到另一個實體(或節點)的資料 。資料流向的實體被稱為節點   ,資料流起源的節點是源節點(例如左側的英格蘭),流結束的節點是目標節點(例如右側的威爾士),源節點和目標節點通常表示為帶有標籤的矩形。

 

流動本身由直線或曲線路徑表示,稱為連結。連結的寬度與流的量 / 數量成正比。在上面的例子中,從英格蘭到威爾士的流動(即居民遷移)比從英格蘭到蘇格蘭或北愛爾蘭的流動(即居民遷移)更廣泛(更多),表明遷移到威爾士的居民數量多於其他國家。桑基圖可用於表示能量、金錢、成本的流動,以及任何具有流動概念的事物。

 

米納爾關於拿破崙入侵俄羅斯的經典圖表可能是桑基圖表最著名的例子。這種使用桑基圖的視覺化非常有效地顯示了法國軍隊在前往俄羅斯和返回的途中是如何進步(或減少?)的。

現在,讓我們看看如何使用 智分析繪製桑基圖。

如何繪製桑基圖?

下面教一下大家如何繪製桑基圖,首先讓我們先準備一份某超市的訂單資料來源。該資料來源包含了該超市 4 年間的訂單的詳細資訊,有訂單 ID 、訂單日期、客戶名稱、產品名稱等相關欄位。接下來繪製一個桑基圖來了解一下這個超市年間的 RFM 客戶流向情況。

製作桑基圖的工具有很多,我這裡選用的是智分析這個工具,因為操作相對比較簡單,而且可以直接匯入 Excel 資料。匯入資料來源的方法如下,點選資料連線裡的 Excel 檔案資料來源,讀取本地的檔案後便可以把資料來源上傳到智分析裡,如果用資料庫的話也可以連線資料庫去讀取資料。

資料上傳成功後,要先對資料進行清洗,我這裡運用的是智分析的 ETL 元件, ETL 元件是一個非常強大的資料清洗工具,無論是多複雜的資料都可以清洗乾淨。因為我們這次要觀察的是 RFM 客戶流向的情況,所以要在 ETL 裡利用 SQL 語句製作一個 RFM 模型,對客戶的特徵進行判定,詳細的製作過程可參考我前面的 RFM 模型製作文章。

執行完 ETL 的程式後,最終輸出的結果如下,資料集按照年份、起始 RFM 分類、結束 RFM 分類、數量的方式進行排列:

製作好了資料集之後,開啟智分析的儀表盤,把圖形的元件拖拽到儀表盤裡,並在智慧配圖裡找到桑基圖的圖形元件:

把起始 RFM 分類、結束 RFM 分類兩個欄位拖拽到列區,並把數量拖拽到度量區,便可以生成一個還不錯的桑基圖:

透過生成的桑基圖,我們可以清晰地看出這四年間每一個層次的客戶流向情況,以便於我們後面採取針對性措施,對每一個層次的客戶實行不一樣的維護策略。桑基圖還可以描述很多現實中的問題,有興趣的同學不妨好好學習一下這一個強大的視覺化圖形,並運用到其他的領域裡。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69980489/viewspace-2846769/,如需轉載,請註明出處,否則將追究法律責任。

相關文章