如何做到用資料說話(一)
01、前言
“Claire,我來公司3個月了,你是第一個給我講清楚這些圖表到底是幹什麼的人。”
“Claire, where do you learn your presentation skills? You did a great job!”
“Your analysis and presentation is very insightful, Claire. I love the way how you presented the findings.”
以上來自我工作中同事、老闆對我presentation的評價。在我近三年的資料分析生涯中,資料視覺化和presentation一直是工作中的重要部分,present的物件包括但不限於公司內部技術和非技術人員、高管以及客戶中的高管。正是這些經驗的積累,本文我想針對“用資料說話”這一主題,分享給大家我踩過的坑和有效的用資料溝通的技巧,希望能幫你也在工作中清晰有效的呈現資料。
本文內容受眾不只限於資料分析師,因為事實上,不管是金融分析師、產品經理、專案經理、運營專員、市場營銷專員或是銷售經理,在工作中都或多或少需要向同事、老闆、高管、或者客戶用資料來展示自己的業績/專案成果、公司的執行現狀或者客戶的需求滿足。眾所周知, 資料讓你的statement(論據)更具說服力,量化結果也更容易讓人留下深刻印象。
但事情沒有那麼簡單,現實是沒有良好的溝通表達,對方不一定完全理解你的意思,下面讓我們來看看如何“用資料說話”。
作者注:
-
本文側重點在於如何用資料更好的表達自己的觀點,裡面涉及的資料視覺化建議與諮詢公司的報告圖表(更偏靜態和需要閱讀)有一定區別
-
請讀者容忍作者中英混雜的文風
-
作者的工作經歷都是to B(面向企業)的資料分析
-
這部分想分享的內容太多,所以會寫成一個系列
02、有效資料化溝通的知識點
(一)上下文的重要性
一次好的資料化溝通要從介紹需求背景/上下文開始,比如本次meeting的目標是什麼,誰提出了這個分析的需求,需求方想實現什麼效果。再者,不同公司、環境、職級的人對同樣事物的認知和熟悉程度是不同的,比如說某公司第二季度revenue是$1M,很多人可能並沒有概念這個數字的大小、反映的業績好壞,但如果你加上與去年同期的對比、有沒有達到我們的預期(OKR),就會更容易被人理解。
(二)knowing your audience is key(瞭解你的聽眾)
通常情況下,對不同audience做的dashboard都是不同的,比如面向公司內部市場和銷售團隊使用的dashboard,他們希望分析儘量細節(granular),這樣他們可以選取對不同客戶有效的資訊進行pitch(產品推銷)或者回答客戶關於一些細節指標的提問。但如果dashboard是面向客戶企業的非技術人員和C-level的高管來使用,就要更偏向戰略宏觀角度的分析,作圖尤其要注意簡單易懂,不僅一張圖不要放太多內容,也切忌堆砌圖表。
(三)a picture is worth a thousand words(一圖勝千言)
有效的圖表可以讓聽眾更好的記住你的結論,而一個好的圖是不需要使用者思考太多的。下面分享一個技巧和案例:
1. pre-attentive attributes。這是人類大腦對圖表處理的一種潛意識表現,比如顏色的不同、深淺,線的長寬大小、方向,形狀,2-D散點圖等。正是人類的這種資訊處理特質,我們應該在資料視覺化的時候利用起來,用這些特點來highlight我們想突出的insights。顏色最容易被人們觀察到,但不要使用過多顏色,會分散人們的注意力;儘量不使用傾斜的axis label,因為人們需要更多的時間來process,必要時使用縮寫;去掉圖表的邊框而選擇用空白來劃分邊界,因為邊框會吸引受眾的目光,而我們需要受眾的注意力在圖示的細節裡。
2. 同樣的資料,目標不同,選取的圖表也應不同。比如我們有麥當勞不同地區不同月份的銷售額,如下表(fake data)。
當我想知道哪個地區哪個月銷售額最高,一個好的visualization是直接在上表highlight最大值,如下圖:
當我想知道哪些資料達到了每月$100K的銷售目標,用不同顏色的柱狀條形圖+目標水平線來展示。注:這裡需要先unpivot上表。
(四)資料的粒度(granularity)
任何人都能給出一個數字化的結果,但是注意你資料的level of details/granularity 是保證你結果正確的重要前提。比如下表
同一個電影可能有多個類別,這裡不同的類別被分在了不同行。如果要算每個製片廠製作電影的的平均票房,就不能只按製片廠group by算票房的avg,因為同一電影的票房數有重複計算,種類越多的電影,票房的加權也越重。正確的演算法是先去重(de-duplicate),保證每個製片廠的每部電影只有一個票房紀錄,再按製片廠算票房平均值。
另外,這一點在你需要寫SQL進行table join的時候也尤為重要!
(五)actionable next steps
判斷自己資料化溝通的成效之一,是在meeting或者presentation的最後,看audience能否帶著你提供的insights進行一定的決策或者有清晰的下一步規劃,這才保證我們的溝通是有效並能解決實際的問題。
資料分析師在做dashboard時的好習慣
-
理解你要解決的問題。
先自己想想你需要什麼樣的資料支援,再看你要從哪些database或者source table 中獲取資料。
然後寫SQL的時候,對你的結果有一個expectation, run出結果再和自己的expectation比較,起到verify你工作的效果。
-
資料分析師很重要的一個品質我願稱之為skepticism (懷疑精神)。
很多時候當你看到一個奇怪的結果時(比如近三個月銷售額一直在下降),與其立馬投入業務分析,不如先去看看這個結果的生成用了哪些資料,進行了哪些資料轉化,視覺化的操作對不對等等。
如果是資料來源頭的問題(例如資料捕捉不完整),那就需要先把data pipeline的處理修正,再進行分析。
有時候你甚至會發現業務部門讓你做的分析還沒開始就結束了…
-
拿到資料後別急著畫圖,現實生活中已有的資料很可能不是你直接能用來視覺化的資料,你需要進行一定的資料清理和資料轉化。
比如算消費者隨月份的平均訂單花費變化趨勢,你一方面要保證納入計算的資料中銷售量>0,另一方面可以觀察一下消費者平均訂單花費的分佈,必要時去掉一些極端值,或者用quantile來表現趨勢而不是單一的平均值(易受極值影響)。
03、總結
一個好的視覺化報表(dashboard)還有很多細節需要注意,資料視覺化作為“用資料說話”的重要工具,下一節我們會講更多的設計細節。
作者介紹:@吃飯第一名的 Claire,小紅書ID:604627775(不想長大的Claire);美國德克薩斯大學奧斯汀分校商學院碩士;美國某消費者資料平臺資料分析師;負責資料收集、清理、分析、建模、視覺化等;美劇重度愛好者,堅信美食能解決大部分問題的終極吃貨;“資料人創作者聯盟”成員。
來自 “ 一個資料人的自留地 ”, 原文作者:@吃飯第一名的 Claire;原文連結:https://mp.weixin.qq.com/s/1IaKQdmQvHAPr8W2oRrUrQ,如有侵權,請聯絡管理員刪除。
相關文章
- 用資料說話,億級海量資料分析效能瓶頸如何破?
- 用資料說話:北京房價資料背後的資料
- 資料基礎架構如何演進,西部資料有話說架構
- 大資料架構如何做到流批一體?大資料架構
- 黑客說:如何做到 4 天上線一個小程式?黑客
- 資料運營實戰(三):用資料說話,從埋點開始
- 如何說服別人?用故事代替資料
- 用資料說話,《集合啦!動物森友會》到底有多火?
- 程式設計師究竟能幹多少年?用資料說話!程式設計師
- 學會用資料說話-分散式鎖究竟可以多少併發?分散式
- 四說大資料時代“神話”:從大資料到深資料大資料
- 如何做到比大資料更懂使用者?大資料
- 大檔案資料如何做到安全傳輸?
- 說說webpack的熱更新是如何做到的?原理是什麼?Web
- 小米Max續航專項評測:好壞與否用資料說話!
- 資料處理,會“說話”的大機器——資料資訊圖
- 大咖說·對話開源|企業如何用好開源資料庫資料庫
- 如何將AI應用於晶片設計?谷歌有話說!AI晶片谷歌
- 白話說大資料演算法C4.5大資料演算法
- Elasticsearch如何做到億級資料查詢毫秒級返回?Elasticsearch
- 華為雲大資料輕量級解決方案,讓資料“慧”說話大資料
- “用資料說話,從埋點開始”-帶你理解前端的三種埋點前端
- GraphPad Prism 10:讓資料說話,揭示科學奧秘 mac/win啟用版PHPMac
- 用Python爬取《王者榮耀》英雄皮膚資料並視覺化分析,用圖說話Python視覺化
- 關於性的問題,讓大資料來說話大資料
- Elasticsearch 創始人 Shay Banon:讓資料自己說話Elasticsearch
- 星環科技覆蓋十條資料庫賽道如何做到以一當十?資料庫
- 用Excel做資料說明――抽樣說明工具Excel
- 1.3萬億條資料查詢如何做到毫秒級響應?
- 使用者體驗,能不能用資料說話,別說“我感覺…”
- 用資料說話 深度解析華為 2020 年上半年營收增長 13.1%營收
- 薪資福利上漲龜速——大資料從業者有話說大資料
- 【MySQL】白話說MySQL(五),資料的匯出與匯入MySql
- 專訪Elasticsearch創始人ShayBanon:讓資料自己說話Elasticsearch
- 資料說話:怎樣的程式設計師最搶手?程式設計師
- 資料說話:擇業,選穩定?還是個人價值?
- InfluxDB vs TDengine,用資料“說”效能UX
- 資料運營 | 次日留存 50%,《果凍消消樂》如何做到的?