關於視覺化的五大誤區 by Nathan Yau@FlowingData

新華字典發表於2014-03-19

enter image description here FlowingData的作者Nathan Yau最近受邀去美國國家統計局指導幫助他們做資料視覺化。這段經歷讓他感慨頗多,於是在FlowingData上發文討論了他在和統計局的專家們討論時 注意到的視覺化的五大誤區。我們看了也心有慼慼焉。於是決定把原文大致翻譯一些,分享給大家,一起討論討論。

視覺化讓資料更炫 這個恐怕是最常見的誤解了。在看了眾多視覺化和資訊圖後,絕大多數人都很自然的想要讓自己的資料也變成那樣。於是人們最常問我的問題就是:”我有怎麼樣怎麼 樣的資料,有什麼好的視覺化方法可以讓他們看起來更炫呢?“ 不管你花多少時間讓圖示更好看,讓圖更精緻,如果你只有五個資料點,就別想了。一個視覺化之所以有意思,是因為背後的資料有意思。

比如,大家都非常喜歡我製作的視覺化:沃爾瑪的擴張。這個視覺化充分展現了沃爾瑪的擴張策略:在一個地方落地生根,然後迅速向附近地區蔓延。儘管我花了不少時間美化這個視覺化,但是Toby Segaran的原始版本一樣展示了類似的資訊,也很有意思。再來看看另一個視覺化:Taget的擴張。它用了一模一樣的視覺化,但是就不那麼有意思了。因為Target的擴張並沒有象沃爾瑪那樣有策略。

對於視覺化來說,首要的一定是資料。視覺化之所以有趣是因為它能展現簡單的資料列表所不能表現的資訊。

軟體和工具無所不能 有各種各樣的視覺化工具。至於哪個最好,還得是具體問題具體分析。我最常用的是R和Illustrator。最近,我開始學習使用JavaScript。工 具的靈活性對我來說非常重要。我想要能最大限度的定製最後生成的視覺化和使用者互動。我的視覺化通常是為一般讀者設計的。但如果我是一個處理海量資料的分析 師,可能會選擇不同的方法。我要說的是,並沒有一款萬能的工具可以包辦一切。有些工具適合用來做資料分析,有的則適合來描述一個故事。

一個圖裡資訊越多越好 人們最常犯的錯誤就是在他們的視覺化裡面堆砌了太多的資訊。我完全贊成在視覺化中提供足夠的背景資訊,並且標註出有意思的資料點。但是凡事總有限度,必要的時候不如把一個複雜的圖一分為二。 有 人嘗試在通過加多個座標軸,或者用大量的視覺線索(visual cues)讓一個圖表能包含更多的資訊。有時候是可以的。但是更多的時候,這並不可行。通常,一個簡單清楚的圖更有效。我最常做的事就是給一個既不瞭解這 個資料,也不懂視覺化的路人看我的視覺化。問問他們從中得到了什麼資訊。

視覺化是主觀片面的,所以沒有用。 視覺化的過程中不可避免的總是有設計師的主觀意識。比如選擇顯示哪部分資料,選擇用什麼樣的方式視覺化。但是如果你理解你處理的資料,誠實的對待資訊,就能 避免犯主觀片面的錯誤。其實,哪怕數學統計某種程度上也是主觀的。因為你選擇了要分析的資料和分析方法,最後寫報告的時候也選擇了要說的結論。 新聞媒體每天都在面對這樣的問題。他們要理解資料,進行選題。建議看看紐約時報的視覺化,看看他們是怎樣客觀的描述資料的。

視覺化一定要精確 如果你在視覺化中顯示了每一個資料的精確值和標準誤差,這個視覺化恐怕不怎麼樣。準確是重要的。但是視覺化並不是關於某一個孤立的資料的。更多的是展現資料 在時間和空間上的分佈和變化。我們要展現的是資料中潛在的特徵。所以我們在視覺化的時候真正要做的是比較和抽象。如果你需要看到每個資料點,那把所有數字 放在一個列表裡顯然更合適。

想聽Nathan Yau侃資料視覺化知識,就讀《資料之美:一本書學會視覺化設計》,噹噹網、京東網、亞馬遜等網上書城及書店熱賣中!

《資料之美:一本書學會視覺化設計》(Data Points: Visualization That Means Something) 《鮮活的資料》(Flowing Data)作者最新力作,《大資料時代》作者、《經濟學人》大資料主編肯尼思·庫克耶傾情推薦,中國人民大學出版社2014年3月出版,敬請關注!

相關文章