資料分析師之視覺化工具推薦指南

weixin_33785972發表於2019-01-17
13825820-7423864e49176ea9.jpg

雙十二一過,元旦也悄然飄去,不能抓住2018年末的尾巴了,2019的大門隨即開啟,我相信這個時候財務工作的小姐姐或者“表哥表姐”就開始為年度彙報工作發愁了:彙報量大,資料多,資料檔案更是一個又一個……傳統的表格自己看這都費勁,不能抓住主要資訊第一時間,何況你的老闆,還好,世界上還有資料視覺化這麼個黑科技。今天就誠意滿滿為你列出好用的資料視覺化工具清單!

資料視覺化

我相信聰明的你戳進這篇推文大概率是知道什麼是資料視覺化的,不過我們也照顧照顧暫時還不知道這個概念的同學,來,簡單說說什麼是資料視覺化。

資料視覺化主要旨在藉助於圖形化手段,清晰有效地傳達與溝通訊息。

為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的資料集的深入洞察。

資料視覺化與資訊圖形、資訊視覺化、科學視覺化以及統計圖形密切相關。

好用的資料視覺化工具

強大的R視覺化包-ggplot2

R是一款偏向於統計分析的指令碼語言軟體,基於S語言開發,如果你是R語言忠實fans,我相信你一定不會不知道R裡單獨的一個繪圖包—ggplot2,之所以給ggplot2“強大”的頭銜,一方面確實能夠輕鬆應付各個領域的影象繪製,靜態的,動態的,說的出名字的,個性化特製的;另一方面小編就是學統計學的,自然相對熟悉這個包。

ggplot2由Hadley Wickham在2005年創造。受歡迎的原因是將圖形分解為語素(如尺度、圖層)的思想。ggplot2可以作為R語言基礎繪圖包的替代,同時ggplot2預設有多種印刷及網頁尺寸。

13825820-35f537ddcd76da32.png

較R基礎繪圖包而言,ggplot2允許使用者在更抽象的層面上增加、刪除或轉換圖表中的元素。 這種抽象化的代價是執行速度。ggplot2 較 lattice 繪圖包而言更耗時。

資料科學的達芬奇—matplotlib

如果你偏好使用python做資料分析,那我相信你對matplotlib不能再熟悉了,matplotlib 是Python語言及其數學擴充套件包 NumPy的視覺化操作介面。

Matplotlib的優點:帶有內建程式碼的預設繪圖樣式;與Python的深度整合;圖形繪製相較Gnuplot更加美觀。缺點嘛,高度依賴其他包,如Numpy。只適用於Python:很難在Python以外的語言中使用。

我們來用python裡的matplotlib做一個散點圖試試:

import matplotlib.pyplot as plt

from numpy.random import rand

a = rand(100)

b = rand(100)

plt.scatter(a,b)

plt.show()

13825820-340610f11b0d503d.jpg

選單式操作使用者的福音書—Tableau

近期有企業招聘要求會Tbaleau,小編也是最近才知道這個軟體的。

tableua是一家軟體公司總部設在西雅圖,華盛頓,美國產生互動式資料視覺化產品,著重於商務智慧。Tableau產品查詢關聯式資料庫,OLAP多維資料集,雲資料庫和電子表格,然後生成許多圖表型別。產品還可以從其記憶體資料引擎中提取資料並儲存和檢索。

13825820-b170024dd5e6e3fa.jpg

微軟忠實使用者離不開的互動式標板—PowerBI

Power BI是Microsoft提供的業務分析服務。它提供具有自助式商業智慧功能的互動式視覺化,終端使用者可以自行建立報告和儀表板,而無需依賴資訊科技人員或資料庫管理員.PowerBI與excel無縫接入,專業增強版的excel更是不需要安裝PowerBI外掛,開啟excel就可使用了。

13825820-69655366fe878c71.jpg

當然有些資料分析軟體也帶透視表、繪圖功能,如MySQL、SPSS,但資料視覺化不作為主要功能,這裡就不如上面較詳細說了。

目前,CDA資料分析研究院除了tableau(後期可能會開設),上述講到的資料視覺化工具,我們都有相應的教學課程內容,如果一心想通過資料視覺化工具來提升自己的工作效率和提高自己技能的話,可以前來問詢。當然,如果你自己知道其他的視覺化軟體,歡迎聰明的你在推文下面留言,互相學習哦~比心!

https://www.cda.cn/?seo

相關文章