如何成為資料分析師系列(一):視覺化圖表初階
作者介紹:鍾家福:目前就職於一家網際網路創業公司,負責 資料分析、BI&ETL平臺搭建與開發。資料愛好者,知乎Id:「月下柳人松」,專欄傳送門:。
本文首發於知乎月下柳人松專欄,連結:想要
簡述
資料視覺化-透過圖表形式展現資料,幫助使用者快速、準確理解資訊。準確、快速是視覺化的關鍵,好的視覺化會“講故事”,能向我們揭示資料背後的規律。對於視覺化,有一個常見誤區:分析師追求過於複雜的圖表,反而使得業務人員難以理解。其實越簡單的圖表,越容易被理解,而快速易懂地理解資料,正是視覺化最重要的目標。
大多數人對於基礎的資料圖表都有一定的認知,但卻未必清楚,在哪一種場景使用何種圖表,本文主要給大家介紹基礎圖表的特性,讓大家知道在何種場景使用該型別圖表。
圖表的基本組成元素
一張圖表至少包含:標題、橫縱座標軸、資料系列、資料標籤、圖例等部分,每一部分都在圖表中扮演特定的角色表達特定的資訊。當然這些元素並不是必須具備的,當資訊足夠清晰時,你可以精簡部分元素,使得圖表更加簡潔。
正確理解維度與指標
維度(Dimension)
類別型欄位、一般是離散的、不可進行四則運算
常常是觀察資料的角度,往往是橫座標
度量/指標(Measure)
數值型欄位、一般是連續的、可進行四則運算
一般都是資料的數值化衡量,往往是縱座標
------------------------分割線----下面是4種常見、常用基礎圖表-------------------------------
1. 折線圖“家族”
折線圖的核心思想是 趨勢變化。
作為資訊最明瞭的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:
基礎折線圖
技巧1:新增關鍵運營事件標記
技巧2:新增趨勢線,當R²>0.6時可採納該趨勢線,R²越接近1,趨勢越可靠
堆積面積圖
面積大小對應該類別數值大小,反映不同類別佔比關係及其時間趨勢變化。以下圖為例,你可看出AppStore和360下載量Top1、2的渠道。
缺點:由色塊面積來表示數值大小有時候不直觀。以下圖為例,需仔細看圖才能知道AppStore和360手機助手是有做過投放的
折線圖小結
1)折線圖是點、線連在一起的圖表,可反映事物的發展趨勢和分佈情況;
2.)適合在單個資料點不那麼重要的情況下表現變化趨勢、增長幅度。
2. 柱形圖“家族”
柱形圖的核心思想是 對比
累加柱形圖
適合少量類別的對比,且對比資訊特別清晰
與堆積面積圖相比,堆積面積圖比累加柱形圖多一時間維度,它可表達時間維度上的趨勢變化。
多指標柱形圖
主要運用於多個指標進行對比分析的場景,但類別物件不宜過多,當超過5個,不適合使用此圖表
技巧:當各對比指標大小相差10倍甚至更大時,可採用標準化,如:對數值取自然對數,既能有效縮小指標量度差距,也能保留同指標的大小關係
條形圖
當對比物件類別>5時,將多指標柱形圖更改為單指標的條形圖,能有效提高資料對比清晰度
條形圖,必須按照數值大小降序排列,這是提升條形圖閱讀體驗的重要手段
瀑布圖
核心是按維度/指標下鑽分解,如:公司收入各用途分解、公司年利潤按分公司分解、業績按銷售團隊分解;
對比餅圖的優勢在於,拆解項較多時,瀑布圖透過數字的標記仍可清洗辨別,而餅圖在分解項>5時就不易辨別。
柱形圖結合折線圖
對比多個指標,尤其是對比指標與指標的增長率上非常適用,使得一個圖表可以表現兩個層次的資訊。(當然要儘可能避免資訊的重複。如下圖,折線圖含義如果換成團隊簽約數佔公司總簽約數比例,則意義不大)
使用雙座標軸,要表明清晰
直方圖
當橫座標變成連續的分組,就可以製作直方圖(與柱形圖主要差別在於,直方圖一般不同資料系列沒有間距)
當組別劃分無限細化,我們就可以繪製機率分佈曲線或者稱為密度曲線,最常見的就是正態分佈,這裡不舉例。
柱形圖小結
1) 核心是對比,柱形圖的目的是將對比資訊放大,直觀呈現出來;
2) 由於直觀,柱形圖適合做結論的表達;
3) 柱形圖一般不用在時間維度的變化;
4) 柱形圖的資料系列和點不宜過多,否則建議改變圖表形式;
5) 柱形之間的寬度儘量小於柱形本身的寬度。
3. 散點圖“家族”
散點圖的核心思想是 研究
研究型圖表,適合用於發現變數間的關係與規律,不適合用於清晰表達資訊的場景
基礎散點圖
基礎散點圖觀察兩個指標的關係
氣泡圖
在基礎散點圖上新增一個維度:用氣泡大小表示新的一個維度
下圖中,氣泡大小表示配送費用
基於散點圖的分類矩陣
分類運營,精準運營是現代化運營的一個重要課題,透過分類矩陣進行分類是一個有效手段
難點1: 構建指標可用於分類的橫縱座標軸指標,這需要很強的業務認識
難點2: 確定指標的分界點,同樣需要足夠的業務判斷能力
散點圖小結
1) 散點圖作為研究型圖表,經常在資料分析前期被使用,在報告中很少見;
2)散點圖不夠直觀,大多時候不能直接表達結論;
3)散點圖對於業務敏感度和資料意識要求較高;
4)散點圖只是入門的鑰匙,發現規律只是分析的切入口。
4. 餅圖“家族”
餅圖的核心思想是 分解
基礎餅圖
技巧:將需要突出顯示的部分,置於左上角,順時針方向
旭日圖
旭日圖在基礎餅圖上可表達更多層次的分解關係,如下圖:有季度分解、月度分解、再到每週,且每個維度之間可相容包含
餅圖小結
1) 一般來說,數值最大的部分排在最前面,也就是12點鐘方向順時針;
2) 餅圖的細分項不宜過多,一般不超過8項;
3) 不要製作三維的餅圖,不直觀;
4) 切忌將餅圖拉得過開,若要突出某一塊,可單獨將其拉開。
其實,個人覺得餅圖在實際場景中應當儘可能少的使用(因人眼對面積大小不敏感),而且對指標的分解柱形圖同樣能勝任,且遠遠清晰於餅圖。
當且僅當,用於反應單個模組佔整體比重時,適合用餅圖,如下圖:
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555699/viewspace-2287189/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 一張圖:資料分析師的完整資料視覺化指南圖視覺化
- 資料視覺化如何選擇合適的視覺化圖表?視覺化
- 資料視覺化:基本圖表視覺化
- 資料視覺化圖表之折線圖視覺化
- Echarts資料視覺化,easyshu圖表整合。Echarts視覺化
- Charts.css:資料視覺化圖表框架CSS視覺化框架
- 如何成為網站資料分析師?網站
- 資訊圖系列文章(四):資料視覺化及資訊視覺化的設計資源視覺化
- 資料分析師們的不可不讀的資訊圖與資料視覺化圖書視覺化
- 視覺化圖表教程:業務資料地圖的繪製視覺化地圖
- 資料圖表方案,企業影片生產資料視覺化視覺化
- 如何看待資料視覺化?視覺化
- 資料視覺化常用圖形都有哪些(一)視覺化
- 資料視覺化最有價值的50個圖表視覺化
- 資料視覺化,BizCharts圖表庫入坑歷程視覺化
- QuickBI助你成為分析師-資料建模(一)UI
- ECharts與資料視覺化:如何高效使用JavaScript實現複雜圖表Echarts視覺化JavaScript
- 圖撲視覺化圖表元件之股票資料分析應用視覺化元件
- 資料視覺化:圖片增強圖表的七種方法視覺化
- Python Seaborn綜合指南,成為資料視覺化專家Python視覺化
- 資料視覺化高階技巧——以哈伯曼癌症生存資料為例視覺化
- 什麼是資料視覺化,為什麼資料視覺化很重要?視覺化
- 資料分析 | 資料視覺化圖表,BI工具構建邏輯視覺化
- 如何做好資料視覺化視覺化
- DT時代,如何成為一名合格的電商資料分析師?
- 資訊圖系列文章(一):資料視覺化是怎樣創造出來的視覺化
- TCGA系列--TCGA視覺化資料庫GEPIA視覺化資料庫
- 資料視覺化之風向圖視覺化
- 為什麼要做資料視覺化視覺化
- 如何成為資料分析師之基本素質篇
- 乾貨|進階篇!分享三種常用地圖視覺化圖表地圖視覺化
- [資料分析與視覺化] Python繪製資料地圖2-GeoPandas地圖視覺化視覺化Python地圖
- 資料視覺化:圖表篇(1)—— 基本柱狀圖、堆疊柱狀圖視覺化
- 文字資料視覺化(下)——一圖勝千言視覺化
- 28個資料視覺化圖表的總結和介紹視覺化
- 寶藏級BI資料視覺化功能|圖表聯動分析視覺化
- 如何利用散點圖矩陣進行資料視覺化矩陣視覺化
- 資料視覺化設計的小白高階進階攻略視覺化