【閱讀】資料之美,一本書學會視覺化設計

ImagineCode發表於2017-09-20

這裡把《資料之美,一本書學會視覺化設計》的摘抄分享下吧,圖示上有不清晰的地方還請包容。

你真的理解資料了嗎?

這裡寫圖片描述
1.對原始資料瞭解得越多,打造的基礎就越堅實,也就越可能製作成令人信服的資料圖表。

2.好的視覺化設計,需要具備統計學和設計方面的知識。

3.視覺化創作是一個迭代的過程,不同的資料集迭代週期不同。

4.由於資料代表了一定的人物、地點和事物,所以除了真實的數字之外,還有重要的背景資訊。

5.注意,垃圾資訊的相對而言。一個圖表需要剔除的東西,在另一個圖表中也許是有用的。

資料引導視覺化設計

這裡寫圖片描述
1.好的圖表,不只是要能快速理解,還包括它顯示的內容如何,以及它是否幫助你看到了之前沒有看到的東西。

2.要想把資料視覺化,就必須知道它表達的是什麼。資料描繪了現實的世界。與照片捕捉了瞬間的情景一樣,資料是現實世界的一個快照。

3.資料和它所代表事物之間的關聯既是把資料視覺化的關鍵,也是全面分析資料的關鍵,同樣還是深層次理解資料的關鍵。

4.應用:GPS追蹤信心、追蹤個人體重、飲食、就寢時間等相關資訊

掌握視覺化設計的原材料

這裡寫圖片描述
1.資料會因其可變性和不確定性而變得複雜,但放入合適的背景資訊中,就會變得容易理解了。

2.實際上,如果你不知道自己在尋找什麼,那麼再細的圖示也會難以理解。

3.一個獨立的離群值可能是需要修正或特別注意的。也許在你的體系中隨著時間推移發生的變化預示有好事(或壞事)將要發生。週期性或規律性的事件可以幫助你為將來做好準備,但面對那麼多的變化,它往往就失效了,這時應該退回到整體和分佈的粒度來進行觀察。

4.在基於不確定因素的估算下,資料誤差是存在的。如果不考慮資料的真實含義,或者沒有確保描述清楚,很容易產生誤解。

5.當我們對某些資料模糊不清的時候,資料所依存的背景資訊就發揮作用了。背景資訊可以完全改變你對某一個資料集的看法,它能幫助你確定資料代表著什麼以及如何解釋。

6.使用資料而不瞭解除了數值本身之外的任何資訊,就好比拿斷章取義的片段作為文章的主要論點引用一樣。

不瞭解資料,一切皆是空談

這裡寫圖片描述
1.你必須首先了解何人、如何、何事、何時、何地以及何因,即後設資料,或者說關於資料的資料,然後才能瞭解資料的本質是什麼。

2.1何人(who):如“誰收集了資料”、“資料是關於誰的”
關鍵在於樣本要在人群中平均分佈,這樣才可以代表整體。

2.2如何(how):你不需要知道每種資料集背後精確的統計模型,但要小心小樣本,樣本小,誤差率就高;你也要小心不合適的假設,比如包含不一致或不相關資訊的指數或排名。

2.3何事(what): 你要自導自己的資料時關於什麼的,你應該知道圍繞在數字周圍的資訊的是什麼。
用相同的方法對待所有的資料集,用千篇一律的方法和工具處理所有資料集,這是一種嚴重的錯誤!

2.4何時(when):你必須清楚資料是什麼時候採集的。不要把舊的資料當成現在的來對付!事在編,人在變,地點也在變,資料自然也會變。

2.5何地(where): 事情會隨著時間變化,也會隨著城市、州、國家的不同而變化。不要將來自少數幾個國家的資料推及整個世界。

2.6為何(why):你必須瞭解採集資料的原因,這樣才能檢查資料是否存在偏頗。

所以,首要的任務是竭盡所能瞭解自己的資料,你的資料分析和視覺化會因此增色!

讓視覺化設計更為清晰

這裡寫圖片描述
1.如何涉及資料隱私的地方,最好限制一下你所展示和觀察到的資訊。

2.富互動式敘事技術,即將視訊、音訊和文字等多種型別的媒體與視覺化相結合,讓使用者參與互動實驗。

3.流程圖就是溝通中和進行決策時可用的一種直接明瞭的方法。你從一個狀態開始,然後回答問題,轉移到另一個相鄰的狀態,最後進入到幫助你做決定的狀態。

4.所謂視覺化資料,其實就是根據數值,用標尺、顏色、位置等各種視覺暗示的組合來表現資料。深色和淺色的含義不同,二維空間中右上方的點和左下方的點含義也不同。

5.視覺化是從原始資料島條形圖、折線圖和散點圖的飛躍。

6.對於視覺化,如果你知道如何解釋資料以及圖形元素是如何協作的,得到的結果通常比軟體做的好。

7.先總覽,在縮放不能幹篩選,然後按需尋找細節。—《The Eyes Have It》

8.資料具有不確定性,因為每個資料點都是對某一瞬間所發生事情的快速捕捉,其它內容都是你推斷的。

9.否定的事情,用下降來表示減少更合理。
這裡寫圖片描述

別忘了,你是為讀者進行視覺化設計

高亮顯示重點內容

這裡寫圖片描述
1.視覺化圖表具有可讀性,能幫助人們理解資料,並總結出資料表達的內容。在報告中嵌入圖表,或給圖表配上文字說明,可以詳細地解釋結論。然而,把視覺化圖形從報告中抽出來,或者斷開它和提供背景資訊的文字間的聯絡,資料可能就會失去它的含義。更糟糕的是,其他人可能會曲解你想表達的內容。

2.高亮顯示能引導讀者在茫茫資料中一下子就能看到重點。它既可以加深人們對已看到東西的印象,也可以讓人們關注到那些應該注意的東西。時時牢記資料、視覺暗示和可讀性。

3.視覺化圖表可以純粹從美學的角度欣賞,但最有趣的還是資料。這就是為什麼視覺化要從資料開始,探索資料,然後展示結果,而不是從視覺化開始,然後盡力把資料集放進去,否則,就像是用錘子砸一大把螺絲釘。

4.視覺化的精髓在於理解資料中的關係和模式。
當你沒有資料時,千萬不要硬編出來。

5.用紙上的草圖把你想做的展示出來,這不受電腦技術的限制。知道有限制是好的,但更好的是現有許多想法,然後縮減將之填入數字和時間的限制中。不要把作品限制在電腦能做的範圍內。要告訴電腦你要做什麼,而不是電腦告訴你能做什麼。

6.因為是向別人展示資料,你要考慮到他們會怎樣審視你的作品。你自己是唯一的觀眾時,你就只為一個人設計,只會有一種距離、一個電腦螢幕或一張紙。有其他人時,情況就不一樣了。每個人都有不同的背景、不同的印表機和不同的電腦螢幕解析度,雖然無法滿足所有人的需求,但至少要在合理的範圍內嘗試著對儘可能多的人負責。

7.知道要展示什麼之後,你可以琢磨該怎麼來展示。在電腦上花費大量時間前可以先從紙筆開始,所以你得在身邊放一本筆記本。想到可能有用的東西就要用草圖、塗鴉和草稿記下,然後再試著用電腦轉換它們。

8.資料視覺化的一般過程:把所有東西整合起來,從理解資料,到探索資料,使之清晰,並適應讀者。

9.你的目標是做到取出任何食材——資料,你都能明白它代表了什麼。對自己的資料理解得越深,就能幫助他人理解的越深。資料視覺化就是這樣變得有價值的。
這裡寫圖片描述

將視覺化進行到底

這裡寫圖片描述

視覺化工具

excel、spreadsheets、tableau、

針對特定資料的工具

gephi、imagePlot、樹圖、TileMill、indiemapper、geocommons、ArcGis

程式設計工具

R語言及其擴充套件包(ggplot2統計學視覺化框架,network可建立帶有結點和邊的網路圖,ggmaps基於谷歌地圖openstreetMap及其它地圖的空間資料視覺化工具,animation可製作一系列的影象並將它們串聯起來做成動畫,portfolio通過樹圖來視覺化層次型資料)

js\html\css\svg(視覺化庫d3.js/raphael/js infovis toolkit)

processing 合適程式設計新手

python(matplotlib)

php

插圖工具

Adobe Illustrator

典型的工作流程:用R語言建立基礎圖形,將圖示儲存為PDF檔案,然後用Illustrator來修改顏色、新增標註,最後再加工一下。
這裡寫圖片描述

資料統計

關於資料說明的問題,以及如何從文字檔案和資料庫的一堆數字中篩選出有用資訊,統計學提供了更寬闊的視角。統計學還有助於處理稀疏和損毀的資料。

這裡寫圖片描述

相關文章