如何做到用資料說話(一)

qing_yun發表於2022-11-04

01、前言

“Claire,我來公司3個月了,你是第一個給我講清楚這些圖表到底是幹什麼的人。”

“Claire, where do you learn your presentation skills? You did a great job!”

“Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.”

以上來自我工作中同事、老闆對我presentation的評價。在我近三年的資料分析生涯中,資料視覺化和presentation一直是工作中的重要部分,present的物件包括但不限於公司內部技術和非技術人員、高管以及客戶中的高管。正是這些經驗的積累,本文我想針對“用資料說話”這一主題,分享給大家我踩過的坑和有效的用資料溝通的技巧,希望能幫你也在工作中清晰有效的呈現資料。

本文內容受眾不只限於資料分析師,因為事實上,不管是金融分析師、產品經理、專案經理、運營專員、市場營銷專員或是銷售經理,在工作中都或多或少需要向同事、老闆、高管、或者客戶用資料來展示自己的業績/專案成果、公司的執行現狀或者客戶的需求滿足。眾所周知, 資料讓你的statement(論據)更具說服力,量化結果也更容易讓人留下深刻印象。

但事情沒有那麼簡單,現實是沒有良好的溝通表達,對方不一定完全理解你的意思,下面讓我們來看看如何“用資料說話”。

作者注:

  • 本文側重點在於如何用資料更好的表達自己的觀點,裡面涉及的資料視覺化建議與諮詢公司的報告圖表(更偏靜態和需要閱讀)有一定區別

  • 請讀者容忍作者中英混雜的文風

  • 作者的工作經歷都是to B(面向企業)的資料分析

  • 這部分想分享的內容太多,所以會寫成一個系列

02、有效資料化溝通的知識點

(一)上下文的重要性

一次好的資料化溝通要從介紹需求背景/上下文開始,比如本次meeting的目標是什麼,誰提出了這個分析的需求,需求方想實現什麼效果。再者,不同公司、環境、職級的人對同樣事物的認知和熟悉程度是不同的,比如說某公司第二季度revenue是$1M,很多人可能並沒有概念這個數字的大小、反映的業績好壞,但如果你加上與去年同期的對比、有沒有達到我們的預期(OKR),就會更容易被人理解。

(二)knowing your audience is key(瞭解你的聽眾)

通常情況下,對不同audience做的dashboard都是不同的,比如面向公司內部市場和銷售團隊使用的dashboard,他們希望分析儘量細節(granular),這樣他們可以選取對不同客戶有效的資訊進行pitch(產品推銷)或者回答客戶關於一些細節指標的提問。但如果dashboard是面向客戶企業的非技術人員和C-level的高管來使用,就要更偏向戰略宏觀角度的分析,作圖尤其要注意簡單易懂,不僅一張圖不要放太多內容,也切忌堆砌圖表。

(三)a picture is worth a thousand words(一圖勝千言)

有效的圖表可以讓聽眾更好的記住你的結論,而一個好的圖是不需要使用者思考太多的。下面分享一個技巧和案例:

1. pre-attentive attributes。這是人類大腦對圖表處理的一種潛意識表現,比如顏色的不同、深淺,線的長寬大小、方向,形狀,2-D散點圖等。正是人類的這種資訊處理特質,我們應該在資料視覺化的時候利用起來,用這些特點來highlight我們想突出的insights。顏色最容易被人們觀察到,但不要使用過多顏色,會分散人們的注意力;儘量不使用傾斜的axis label,因為人們需要更多的時間來process,必要時使用縮寫;去掉圖表的邊框而選擇用空白來劃分邊界,因為邊框會吸引受眾的目光,而我們需要受眾的注意力在圖示的細節裡。

2. 同樣的資料,目標不同,選取的圖表也應不同。比如我們有麥當勞不同地區不同月份的銷售額,如下表(fake data)。

當我想知道哪個地區哪個月銷售額最高,一個好的visualization是直接在上表highlight最大值,如下圖:

當我想知道哪些資料達到了每月$100K的銷售目標,用不同顏色的柱狀條形圖+目標水平線來展示。注:這裡需要先unpivot上表。

(四)資料的粒度(granularity)

任何人都能給出一個數字化的結果,但是注意你資料的level of details/granularity 是保證你結果正確的重要前提。比如下表

同一個電影可能有多個類別,這裡不同的類別被分在了不同行。如果要算每個製片廠製作電影的的平均票房,就不能只按製片廠group by算票房的avg,因為同一電影的票房數有重複計算,種類越多的電影,票房的加權也越重。正確的演算法是先去重(de-duplicate),保證每個製片廠的每部電影只有一個票房紀錄,再按製片廠算票房平均值。

另外,這一點在你需要寫SQL進行table join的時候也尤為重要!

(五)actionable next steps

判斷自己資料化溝通的成效之一,是在meeting或者presentation的最後,看audience能否帶著你提供的insights進行一定的決策或者有清晰的下一步規劃,這才保證我們的溝通是有效並能解決實際的問題。

資料分析師在做dashboard時的好習慣

  • 理解你要解決的問題。

    先自己想想你需要什麼樣的資料支援,再看你要從哪些database或者source table 中獲取資料。

    然後寫SQL的時候,對你的結果有一個expectation, run出結果再和自己的expectation比較,起到verify你工作的效果。

  • 資料分析師很重要的一個品質我願稱之為skepticism (懷疑精神)。

    很多時候當你看到一個奇怪的結果時(比如近三個月銷售額一直在下降),與其立馬投入業務分析,不如先去看看這個結果的生成用了哪些資料,進行了哪些資料轉化,視覺化的操作對不對等等。

    如果是資料來源頭的問題(例如資料捕捉不完整),那就需要先把data pipeline的處理修正,再進行分析。

    有時候你甚至會發現業務部門讓你做的分析還沒開始就結束了…

  • 拿到資料後別急著畫圖,現實生活中已有的資料很可能不是你直接能用來視覺化的資料,你需要進行一定的資料清理和資料轉化。

    比如算消費者隨月份的平均訂單花費變化趨勢,你一方面要保證納入計算的資料中銷售量>0,另一方面可以觀察一下消費者平均訂單花費的分佈,必要時去掉一些極端值,或者用quantile來表現趨勢而不是單一的平均值(易受極值影響)。

03、總結

一個好的視覺化報表(dashboard)還有很多細節需要注意,資料視覺化作為“用資料說話”的重要工具,下一節我們會講更多的設計細節。

作者介紹:@吃飯第一名的 Claire,小紅書ID:604627775(不想長大的Claire);美國德克薩斯大學奧斯汀分校商學院碩士;美國某消費者資料平臺資料分析師;負責資料收集、清理、分析、建模、視覺化等;美劇重度愛好者,堅信美食能解決大部分問題的終極吃貨;“資料人創作者聯盟”成員。


來自 “ 一個資料人的自留地 ”, 原文作者:@吃飯第一名的 Claire;原文連結:https://mp.weixin.qq.com/s/1IaKQdmQvHAPr8W2oRrUrQ,如有侵權,請聯絡管理員刪除。

相關文章