第一篇:Power BI資料視覺化概述

穆晨發表於2016-04-14

前言

        "視覺化之工具,可愛者甚蕃。統計學家獨愛R,自Python來,世人盛愛matplotlib。餘獨愛Power BI之出微軟而不染(免費),濯Office而不妖(夠精簡)......."。先開個玩笑,哈哈^_^。

        本文向大家介紹微軟公司最近釋出的視覺化神器 - PowerBI。將重點講解它的主要功能、和同類視覺化工具的對比、以及基本使用方法。

        本系列後面文章則將針對該工具的具體使用進行詳細深入的講解。

Power BI的主要功能

        顧名思義,PowerBI是一款BI(商務智慧)工具,能在較短時間內生成各種酷炫的報表。所以它主要完成下面三個工作:

        1. 報表製作與釋出

        2. 報表製作與釋出

        3. 報表製作與釋出

        重要的事情說三遍,哈哈~

Power BI的主要特點

        世面上的BI工具那麼多,為何筆者重點推薦這款BI工具呢?這主要是因為它具備下面幾大特點:

        1. 打通各類資料來源

        Power BI能夠從各種資料來源中抓取資料進行分析,除了支援微軟自家產品如Excel,SQL Server等,各類資料庫如Oracle,My SQL,IBM DB2等,還支援從R語言指令碼,Hdfs檔案系統,Spark平臺等等地方導資料。下圖是Power BI的資料匯入視窗:

        Power BI還支援直接從網頁抓取資料。下篇中會演示以網頁抓取的方式獲取資料。比較高大上吧:)

        2. 易用性(無需程式設計)

        筆者給自己的定位是一枚資料科學家,因此不會也不能將過多精力放在視覺化工作上。畢竟資料庫/資料倉儲系統架構,資料探勘演算法研究等工作更是重中之重。而Power BI採用的拖拉控制元件式圖形化開發模式,將我從視覺化的泥潭中解放出來,把更多精力投放到資料管理,演算法研究,業務溝通上。下圖展示了Power BI乾淨而清爽的工作介面:

        這裡展示的僅僅是一個方面,絕大多數商業公司出品的軟體在易用性方面完爆開源產品。

        3. 圖表顏值高

        下面這些圖是筆者10分鐘不到就做好,稍加美化就能達到大部分客戶在顏值上的要求了:

        要知道同樣的工作使用R語言的ggplot2至少要2小時(含除錯),使用Python的matplotlib就更久了。嗯,暫時就說這幾點,再說有打廣告的嫌疑了......

Power BI Vs 其他同類產品

        1. Power BI VS Excel

        都是微軟自家產品,但Excel更全面且更專注於資料分析,而Power BI則比較精簡且更更專注於報表視覺化。另外這兩個產品也是相互打通的,據說最新版本的Excel整合了Power BI外掛,而Power BI裡的資料分析功能也和Excel相似。

        2. Power BI VS R語言ggplot2

        ggplot2其實是R語言的視覺化包,因此對於熟悉R語言的人來說,使用ggplot2會非常得心應手。同時由於ggplot2是由程式語言R驅動,因此它在定製化方面肯定做得比Power BI要好。但這也帶來了一些程式碼量,不是每個人都喜歡。

        本人也是ggplot2的忠實粉絲,部落格裡有R語言ggplot2視覺化教程:點選進入

        3. Power BI VS Python matplotlib

        相對Power BI而言,matplotlib更受程式設計師群體的歡迎。一個特點是程式碼量較大,筆者本人非常討厭,真不知道為什麼那麼多人支援 = =#。那些用matplotlib做的比較好看的圖,程式碼量動輒幾十行上百行,說好的"人生苦短我用python"呢???當然,如果您確實需要經常做一些精細定製化的圖形,也可以考慮使用它。

        4. Power BI VS echarts

        echarts專用於網頁圖表製作,對瀏覽器相容特別好。但它一般是給前端程式設計師用的,需要程式語言javascript驅動,不推薦資料分析師使用。

        5. Power VS 其他商用BI工具(如Tableau等)

        這些商用BI工具的技術通常來說比較專有化,這也就意味著很難找到人交流學習。因此,使用這類工具要慎重,請仔細考慮好具體使用環境和詳細業務場景是否合適後再購買學習吧。

        綜上所述,這些視覺化工具並沒有單純的優劣之分,用哪種得具體問題具體分析。一句話,如果你想糙,快,猛地製作還不錯的報表,那麼就快快學習Power BI吧。

Power BI視覺化思想

        使用Power BI進行視覺化的總體步驟如下:

        1. 首先從資料來源匯入資料。Power BI支援的資料來源格式非常多,前文已說明;

        2. 然後在Power BI後臺區進行資料塑性。資料匯入後,必須確定好資料列名,資料型別是否正確,是否需要進行切分工作,是否需要生成彙總表等等;

        3. 最後在Power BI的圖表區進行報表繪製。具體工作中,這步和上一步工作迭代進行,我們需要不斷對資料進行塑性,並基於塑性好的資料繪製出各種報表;

        這裡讀者只需知道個大概,隨著教程的深入,我會進行具體詳細的說明。

獲取方法

        下載地址:http://www.microsoft.com/zh-cn/download/details.aspx?id=45331

        不知道為啥網上一些搶鮮體驗教程給的下載地址要麼是英文版,要麼是繁體版,要麼32位......安裝方法就無需多說了,畢竟微軟出品。

小結

        有些人可能會對商業軟體帶有一種排斥觀念,個人覺得這是比較幼稚的。商業軟體固然需要花錢,但劣質的開源軟體更可能浪費大家的寶貴時間。顯然我們應該將精力更多的投放到資料和演算法本身以及具體業務上,工具只不過是工具罷了。

        這個觀點比較主觀,不過請不要糾結,因為Power BI是免費的。

        接下來一起開始Power BI之旅吧~

相關文章