“資料分析” 大致可以分為業務和技術兩個方向,不管你是從事哪個方向,都對技能有一定的要求。業務方向,像資料運營、商業分析、產品經理等,對技術的要求相對來說低一點,程式設計工具你只要會用即可(肯定是越精通越好)。技術方向,像資料演算法工程師、資料探勘工程師等,對技術的要求就很高了,必須要有很好的程式設計能力。
工欲善其事必先利其器,說起資料分析工具,大家都會感覺很迷茫,有這麼多資料分析工具,我應該學習哪個工具,它們之間的區別到底是什麼?
今天我們從 “工具” 層面帶大家盤點一下,作為一名資料分析師,應該學習哪些工具呢?
一、Excel工具
說起用什麼做資料分析,很多人的腦海中都會不約而同地想到Python、R、SQL、Hive等看似很難掌握的資料分析工具,它們就像資料分析路上的攔路虎一樣,讓人踟躕不前。
其實,在眾多的資料分析工具中,Excel屬於最常用、最基礎、最易上手的一款資料分析工具。Excel的功能十分強大,它不僅提供了眾多的資料處理功能,像Excel函式能夠幫助我們做資料整理,資料透視表幫助我們快速、高效的做各種維度分析,形形色色的圖表能幫我們形象地展示出資料背後隱藏的規律,同時Excel還有很專業的資料分析工具庫,包括描述性統計分析、相關係數分析等。
Excel對於轉行資料分析的小白來說,應該是最友好的。大家都知道“轉行”其實是一件很困難的事兒,但是你學會了Excel,是完全可以找到一份“資料”相關的工作的,只有踏進資料領域,你才有可能從事其它更多的資料崗位。
二、BI工具
BI工具是專門按照資料分析的流程進行設計的,也是專門用於資料分析的工具。仔細觀察這些工具後,它們的基本流程是:【資料處理】-【資料清洗】-【資料建模】-【資料視覺化】。
關於BI工具,其實有很多你估計已經用到過,比如說Tableau、Power BI,還有帆軟FineBI等。今天我們就分別帶著大家來盤點一下,這三款工具。
1、Tableau
Tableau是一款互動式資料視覺化軟體,它的本質其實也是Excel的資料透視表和資料透檢視。
Tableau也是很好的延續了Excel,只需要簡單地拖拽,就能很快地實現資料的分類彙總,然後拖拽實現各種圖形的繪製,並且可以實現不同圖表之間的聯合。
Tableau同時支援數百種資料聯結器,包括線上分析處理(OLAP)和大資料(例如NoSQL,Hadoop)以及雲資料,至少現在你能學到的資料庫軟體,Tableau基本都能夠實現與其資料之間的互動。
2、Power BI
Power-BI是一款(BI)商業智慧軟體,於2014年釋出,旨在為使用者提供互動式的視覺化和商業智慧,簡單的資料共享,資料評估和可擴充套件的儀表板等功能。。
大家可能都知道,Power BI以前是一款Excel外掛,依附於Excel,比如Power Query,PowerPrivot, Power View和Power Map等,這些外掛讓Excel如同裝上了翅膀,瞬間高大上,慢慢地就發展成為現在的Power BI資料視覺化工具。
Power BI 簡單且快速,能夠從 Excel電子表格或本地資料庫建立圖表。同時Power BI也是可靠的、企業級的,可進行豐富的建模和實時分析,及自定義開發。因此它既是你的個人報表和視覺化工具,還可用專案、部門或整個企業背後的分析和決策引擎。
同時,無論你的資料是簡單的 Excel電子表格,還是基於雲和本地混合資料倉儲的集合, Power BI都可以讓你輕鬆地連線到資料來源,直觀看到或發現資料的價值,與任何所希望的人進行共享。
3、FineReport
帆軟是業內做報表比較久的一家公司,使用類excel風格的介面,可新增圖表和資料來源,也可實現大屏效果。
其實它的類Excel風格介面,應該是它區別於Tableau工具的一個很重要的點。FineReport 透過直接連線到各種資料庫,就能方便快捷地自定義各種樣式,從而製作週報、月報和季報、年報。
用過FineReport 的朋友,還會有另外一種體會,它的圖形效果比Tableau要酷炫的多,操作起來同樣也是那樣的方便。
另外,FineReport 的個人版本是完全免費的,並且所有功能都是開放的,大家趕緊下去試試吧。
4、FineBI
關於FineBI,這是目前市面上應用最為廣泛的自助式BI工具之一,類似於國外的Tableau等BI分析工具,但FineBI在協同配合,資料許可權上,能更好的解決國內企業的情況。
但嚴格定義來講,它其實是一款自助式BI。支援Hadoop、GreenPlumn、Kylin、星環等大資料平臺,支援SAP HANA、SAP BW、SSAS、EssBase等多維資料庫,支援MongoDB、SQLite、Cassandra等NOSQL資料庫,也支援傳統的關係型資料庫、程式資料來源等。
5、Python & R
其實不管是Excel,還是介紹的三款BI工具,它們都是為了執行特定功能,而設計出來的。如果說某一天,既定功能不能很好,或者說不能滿足你的需求,那麼應該怎麼辦呢?
這就需要我們瞭解,並學習一點程式語言了,最大的優勢就在於:它非常強大和靈活。不管是R或者 Python,都有很多包供我們呼叫,同時也可以自定義函式,實現我們的某些需求。
最後,分析工具放在後臺了,大家回個 “BI”就能獲得!