阿里雲大資料認證——大資料Clouder專項技能認證課程:Quick BI企業報表製作-課堂筆記

YBCarry發表於2019-02-25

阿里雲Clouder認證

七、大資料Clouder專項技能認證課程:Quick BI企業報表製作

1. 課程目標

(1) 瞭解圖表特點和適用場景
(2) 能根據場景選擇圖表型別
(3) Quick BI設計報表和門戶
(4) 獨立解決常見的報表需求

(5)目錄
  - 圖形化報表介紹
  - Quick BI簡介
  - 常見圖表解析及製作
  - 任務:搭建企業報表門戶
複製程式碼

2. 圖形化報表介紹

(1)報表

  • **報表:**用表格、圖表等格式來顯示資料。常見的報表格式有數字表格、圖表等。報表是商業智慧(BI)的基礎應用。

(2)資料視覺化

  • **資料視覺化:**是指將相對複雜的資料通過可視的、互動的方式進行展示,從而形象、直觀地表達資料蘊含的資訊和規律。

(3)圖形化報表

  • **圖形化報表:**是報表的一種,也是資料視覺化最常見的方法,通過一些圖示將資料更直觀的展示出來,將資料中關鍵的資訊轉化成可快速獲得的易懂的資訊。

(4)圖表的主要作用

  • **資料展示:**將已知的資料或資料分析結果通過視覺化圖示的方式進行展示,藉助於圖形化手段,清晰有效地傳達溝通訊息。
  • **資料分析:**基於圖表的“二次分析”,對資料的深層次挖掘。通過對圖表中的特點分析,對資料進一步的洞察分析。

(5)圖表設計的步驟

  • **<1>. 明確問題:**這個圖表要解決什麼問題,希望傳達給使用者什麼內容。
  • **<2>. 基本框架:**對整個圖表設計一個初步的框架,即概覽圖。
  • **<3>. 確定指標:**將最終需要提供的資訊轉換成明確的指標。
  • **<4>. 確定圖表型別:**根據要展現的內容和資訊,選擇合適的圖表型別。
  • **<5>. 突出關鍵資訊:**通過圖表設計將使用者的注意力引向關鍵資訊。

(6)好圖表的標準

  • <1>. 直觀易懂匹配需求
  • <2>. 關鍵資訊展示到位
  • <3>. 展示方式選擇合適
  • <4>. 圖表視覺效果良好

(7)企業報表門戶

  • 企業報表門戶(Portal),可以為企業提供一個單一的訪問企業報表資訊的入口,企業的高層、員工及相關人員等都可以申請相應的許可權,通過訪問這個門戶獲得個性化的資訊和服務。

3. Quick BI基本介紹

(1)QuickBI介紹

  • QuickBI(商務/商業智慧)提供海量資料實時線上分析,拖拽式操作、豐富的視覺化效果,可以幫助輕鬆自如地完成資料分析、業務資料探查。它不止是業務人員看資料的工具,更是資料化運營的助推器,解決大資料應用“最後一公里”的問題,實現人人都是資料分析師。
  • QuickBI的應用特點:
    • **多:**支援多種型別資料來源、支援多種視覺化元件
    • **快:**海量資料的實時分析、提供智慧的一鍵加速
    • **好:**靈活的報表整合方案、嚴密的安全許可權管理
    • **省:**門檻低易上手省時間、雲端計算費用低省成本

(2)五步上手Quick BI

  • <1>. 開通服務:
    • 實名認證賬號
    • 登入控制檯
    • 開通Quick BI

  • <2>. 倒入資料:
    • 新建/倒入資料來源
    • 上傳本地資料
    • 編輯資料集

  • <3>. 表格分析:
    • 維度指標設定
    • 多維資料分析
    • 設計表格報表

  • <4>. 圖表設計:
    • 圖形表格設計
    • 報表資料分析
    • 資料門戶製作

  • <5>. 釋出應用:
    • 資料包表釋出
    • 資料分發機制
    • 資料安全管控

4. 常見圖表——柱圖、線圖、餅圖、散點圖、雷達圖、漏斗圖、樹圖、矩陣樹圖、來源去向圖、指標看板、儀表盤、地圖、極座標圖、詞雲圖

(1)柱圖

  • **柱圖:**又稱柱狀圖。是一種以長方形的長度來表達數值的統計報告圖,由一系列高度不等的縱向條紋表示資料分佈的情況。
  • **場景:**適合用於展示二維資料集,其中一個軸表示需要對比的分類維度,另一個軸代表相應的數值,比如:(月份,商品銷量),或者展示在一個維度上,多個同質可比的指標的比較,比如:(月份,蘋果產量,桃子產量)。
  • 優點:
    • 簡單直觀,很容易根據柱子的長短看出值的大小
    • 易於比較各組資料之間的差別
  • **缺點:**不適合較大的資料集展現
  • **類似圖表:**條形圖、直方圖、堆積圖、百分比堆積圖、雙Y軸等

(2)線圖

  • **線圖:**也叫折線圖,將值標註成點,並通過直線將這些點按照某種順序連線起來形成的圖。
  • **場景:**資料在一個有序的因變數上的變化,它的特點是反映事物隨序類別而變化的趨勢,可以清晰展現資料的增減趨勢、增減的速率、增減的規律、峰值等特徵。
  • 優點:
    • 能很好的展現沿某個維度的變化趨勢
    • 能比較多組資料在同一個維度上的趨勢
    • 適合展現較大的資料集
  • **缺點:**每張圖上不適合展示太多條折線
  • **類似圖表:**堆積圖、曲線圖、雙Y軸折線圖、面積圖

(3)餅圖

  • **餅圖:**以餅狀圖形顯示一個資料系列中各項的大小與各項總和的比例,也被稱作扇形統計圖。
  • **場景:**適用於二維資料,即一個分類欄位,一個連續資料欄位,當使用者更關注於簡單佔比時,適合使用餅圖。
  • **優點:**簡單直觀,很容易看到組成成分的佔比
  • 缺點:
    • 不適合較大的資料集展現。
    • 資料項中不能有負值
    • 當比例接近時,人眼很難準確判別
  • **類似圖表:**環形圖、3D餅圖

(4)散點圖

  • **散點圖:**又稱XY散點圖,將資料以點的形式展現,以顯示變數間的相互關係或者影響程度,點的位置由變數的數值決定。
  • **場景:**顯示若干資料系列中各數值之間的關係,類似XY軸。判斷兩變數之間是否存在某種關聯,或者發現資料的分佈或者聚合情況。
  • 優點:
    • 可以展示資料的分佈和聚合情況
    • 適合展示較大的資料集
  • **缺點:**散點圖看上去比較亂,基本只能看相關、分佈和聚合,其他資訊均不能很好展現
  • 類似圖表:氣泡圖

(5)雷達圖

  • **雷達圖:**又稱蜘蛛網圖,將多個維度的資料量對映到起始於同一個圓心的座標軸上,結束於圓周邊緣,然後將同一組的點使用線連線起來。
  • **場景:**雷達圖適用於多維資料集。
  • 優點:
    • 適合展現某個資料集的多個關鍵特徵
    • 適合展現某個資料集的多個關鍵特徵和標準值的比對
    • 適合比較多條資料在多個維度上的取值
  • 缺點:
    • 多維但是維度不能太多,一般四到八個
    • 比較的記錄條數不宜太多

(6)漏斗圖

  • **漏斗圖:**有多個梯形從上到下疊加而成。從上到下的項有邏輯上的順序關係,梯形面積表示某個環節業務量與上一個環節之間的差異。
  • **場景:**適用於業務流程比較規範、週期長、環節多的單流程單向分析,通過漏斗各環節業務資料的比較能夠直觀地發現和說明問題所在的環節,進而做出決策。
  • 說明:
    • 漏斗圖總是開始於一個100%的數量,結束於一個較小的數量
    • 在開始和結束之間由N個流程環節組成,每個環節用一個梯形來表示
    • 梯形的上底寬度表示當前環節的輸入情況,下底表示當前環節的輸出,上底與下底之間的差表現了在當前環節業務量的減小量,當前梯形邊的斜率表現了當前環節的減小率
    • 漏斗圖的所有環節的流量都應該使用同一個度量
  • **類似圖表:**金字塔圖、對稱漏斗圖(旋風)、對比漏斗圖

(7)樹圖

  • **樹圖:**樹圖是通過樹形結構來展現層級資料的組織關係,以父子層次結構來組織物件,是列舉法的一種表達方式。
  • **場景:**適用於與組織結構有關的分析,即有明確的層次關係的資料。
  • 優點:
    • 直觀的展現層次關係
    • 可以看到各層級指標間的關係,可進行簡單的上卷、下鑽等操作
  • 缺點:
    • 資料層級不宜過多
    • 每層的成員不宜過多
    • 無法展現各部分佔比關係
  • **類似圖表:**矩陣樹圖

(8)矩陣樹圖

  • **矩陣樹圖:**採用矩形表示層次結構的節點,父子層次關係用矩形間的相互巢狀來表達。從根節點開始,空間根據相應的子節點數目被分為多個矩形,矩形的面積大小對應節點的屬性。每個矩形又按照相應節點的子節點遞迴的進行分割,直到葉子節點為止。
  • **場景:**適合展現具有層級關係的資料,能夠直觀體現同級之間的比較。
  • 優點:
    • 圖形更緊湊,同樣大小的畫布可以展現更多的資訊
    • 可以展現成員間的權重
  • 缺點:
    • 不夠直觀、明確,不像樹圖那麼清晰
    • 分類佔比太小時不容易排布
  • **類似圖表:**樹圖、馬賽克圖、熱力圖

(9)來源去向圖

  • **來源去向圖:**通過頁面訪問量PV和訪客的數量UV推算出網頁的轉化率,進而可以瞭解網站的整體運營效果和某一類商品的最終成交量。
  • **場景:**適用於電商或與營銷有關係的分析,比如分析購物網站中,哪些商品最暢銷或者哪一個時間段是訪問高峰。
  • 優點:
    • 特別適合分析展現網站流量的運營資料
    • 顯示結果直觀,可以清晰的看到各個維度指標變化的情況
    • 支援以某個節點檢視該節點所在流程的情況
  • 缺點:
    • 應用面很窄,只能顯示三級維度的流程資料
    • 對顯示的度量要求嚴格

(10)指標看板

  • **指標看板:**通過文字、數字和符號的合理排版,對資料進行一目瞭然的展示。由看板標籤和看板指標組成,標籤由維度決定,指標由資料的度量決定。
  • **場景:**適合用來展示一個維度下的一個或者多個度量,特別是對某些指標需要精確讀教的場景。
  • 優點:
    • 展現的是詳細的數字,使用者得到的都是精確資訊
    • 簡單直觀,重點數字突出,容易得到關鍵資訊
  • 缺點:
    • 展現維度只能有一個
    • 展現指標不宜過多
    • 只是數字皮膚,不具有圖形的各種優勢

(11)儀表盤

  • **儀表盤:**像一個鐘錶或者刻度盤,有刻度和指標,其中刻度表示度量,指標表示維度,指標角度表示數值,指標指向當前數值。
  • **場景:**管理報表或報告,直觀的表現出某個指標的進度或實際情況。
  • 優點:
    • 將專業資料通過常見的刻度表形式展現,非常直觀易懂
    • 擬物化的展現更人性化
  • 缺點:
    • 適用場景比較窄,主要用於進度或佔比的展現
    • 只能一個維度,指標也不宜過多,展示資訊有限
  • **類似圖表:**堆積圖

(12)地圖

  • **地圖:**使用地圖作為背景,通過圖形的位置來表現資料的地理位置,將資料在不同地理位置上的分佈通過顏色或者氣泡對映在地圖上。
  • **場景:**適合帶有地理位置資訊的資料集展現,展現的通常是以某個地區為單位的彙總的連續值資訊。
  • 優點:
    • 和地圖相結合,對資料的地理分佈顯示直觀
    • 通過顏色深淺、氣泡大小等容易判斷度量的大小
  • 缺點:
    • 必須有地理資訊,且資料為彙總資料,氣泡容易疊加
    • 顯示的都是非精確值,氣泡大小和顏色深淺相近時不易分辨
    • 地理面積大小和度量值無關,容易誤讀
  • **類似圖表:**氣泡地圖、顏色地圖(分級統計地圖)、描點地圖

(13)極座標圖

  • **極座標圖:**由多個扇區構成的。每個扇區的標籤由資料的維度決定,每個扇區長度由資料的度量決定。每個扇形的角度一樣,通過半各展示變化。
  • **場景:**適用於列舉資料之間的比較,比如顯示一段時間內的資料變化,或顯示各項之間的比較情況。
  • 優點:
    • 視覺效果在部分情況下比其他圖表更佳
    • 同樣的畫布能比部分其他圖表展示資料更多
  • 缺點:
    • 不適合分類過少的資料集
    • 不適合部分度量值過小的資料集
  • **類似圖表:**餅圖、環圖、柱圖、玫瑰圖等

(14)詞雲圖

  • **詞雲圖:**又稱文字雲,是文字資料的視覺表示,由詞彙組成類似雲的彩色圖形,用於展示大量文字資料。每個詞的重要性以字型大小或顏色顯示。
  • 場景:適合用於描述網站上的關鍵字(即標籤),或視覺化自由格式文字,可以對比文字的重要程度。其本質是點圖,是在相應座標點繪製具有特定樣式的文字的結果。
  • 優點:
    • 快速感知最突出的文字,或區別權重不同的文字
    • 可展示大量文字
  • 缺點:
    • 不適合展現的資料太少的資料集
    • 不適展現區分度不大的資料,即無重點關鍵詞
  • **類似圖表:**點圖、柱圖

(15)圖表型別和適用場景

  • **比較——對比各個值之間的差別:**柱圖、雷達圖、漏斗圖、極座標圖、旋風漏斗圖、詞雲圖
  • **佔比——部分佔整體的百分比:**餅圖、漏斗圖、儀表盤、矩陣樹圖
  • **相關——顯示各個值之間的關係:**散點圖、矩陣樹圖、指標看板、樹圖、來源去向圖
  • **趨勢——數值隨維度的變化情況:**線圖、柱圖
  • **地理圖——數值和地理資訊對映圖:**氣泡地圖、色彩地圖

5. 其他資源與說明

(1)進階目標

  • 學習者通過後續的自學,可以掌握:

    • 1-能體會不同圖表間的細微差別;

    • 2-可用圖表對資料進行分析,或能根據圖表,進行一些輔助性的資料分析,如探索性資料分析等;

    • 3-瞭解和本行業或本公司相關的指標體系,熟悉每個常見指標的含義;

    • 4-能根據自己對本行業或者本公司業務的瞭解,整理本行業的指標體系,構建基於本行業或本公司業務的的Portal模板;

(2)補充說明

  • 本實驗所有報表都基於靜態csv資料,使用者實際場景中大部分情況下都是動態資料(即資料來源並非固定的靜態檔案,而是動態變化的業務系統,比如業務資料庫,比如每1小時或者每1天提供一次的檔案等),此時報表設計思路、開發流程基本等同於當前實驗,要注意的是,報表中需要新增 查詢條件控制元件 ,指定預設時間即可。

相關文章