簡述資料分析師需要學什麼內容

danei2017發表於2019-08-12

越來越多的企業需要專業的資料分析師,因為資料分析師可以對專案提出合理的建議,並做出正確的決策,所以資料分析師是很重要的。現在對資料分析師的需求越來越大,越來越多的人想加入資料分析師這一行業,資料分析師需要學什麼?資料分析軟體有哪些呢?

資料分析師需要學什麼 資料分析軟體有哪些_

資料分析師需要學什麼?

1)統計學知識。

這是很大一部分大資料分析師的短板。當然這裡說的不是簡單的一些統計而已。而是包括均值、中位數、標準差、方差、機率、假設檢驗等等具有時間、空間、資料本身。差不多應該是理工科的高等數學的知識,甚至還高一點兒。要能夠建模,要不然你分析出來的結果離實際相差十萬八千里的話,估計要不了幾天,你就會被捲鋪蓋走人了。當然,做個一般的大資料分析師,就不會涉及到很深的高等數學知識了,但要做一個牛B的大資料分析師,還是要學習學習再學習。

2)把EXCEL玩熟悉。

當然不需要掌握的高大全,也得要掌握常用的函式,比如重點包括但不限於sum,count,sumif,countif,find,if,left/right,時間轉換,各種圖表做法等之類的。如果資料量不算是特別大的話,Excel能夠解決很多問題。比如,篩選部分贓資料,排序,挑選滿足條件的資料等等。

3)分析思維的練習。

比如結構化思維、思維導圖、或百度腦圖、麥肯錫式分析,瞭解一些smart、5W2H、SWOT等等那就更好了。不一定要掌握多深多全,但一定要了解一些。

4)資料庫知識。

大資料大資料,就是資料量很多,Excel就解決不了這麼大資料量的時候,就得使用資料庫。如果是關係型資料庫,比如Oracle、mysql、sqlserver等等,你還得要學習使用SQL語句,(m.cnitedu.cn)篩選排序,彙總等等。非關係型資料庫也得要學習,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起碼常用的瞭解一兩個,比如Hbase,Mongodb,redis等。

5)業務學習。

其實對於大資料分析師來說,瞭解業務比了解資料更重要。對於行業業務是怎麼走的對於資料的分析有著非常重要的作用,不瞭解業務,可能你分析的結果不是別人想要的。

6)開發工具及環境。

比如:Linux OS、Hadoop(儲存HDFS,計算Yarn)、Spark、或另外一些中介軟體。目前用得多的開發工具Java、python等等語言工具。

資料分析軟體有哪些?

一、Excel

Excel 是微軟辦公套裝軟體的一個重要的組成部分,它可以進行各種資料的處理、統計分析和輔助決策操作,廣泛地應用於管理、統計財經、金融等眾多領域。

1、資料功能

2、統計分析

3、圖表功能

4、高階篩選

5、自動彙總功能

6、高階數學計算

二、SAS軟體

SAS是全球最大的軟體公司之一,是由美國NORTH CAROLINA州立大學1966年開發的統計分析軟體。SAS把資料存取、管理、分析和展現有機地融為一體。主要優點如下:功能強大,統計方法齊,全,新;使用簡便,操作靈活;提供聯機幫助功能。

三、R軟體

R是一套完整的資料處理、計算和製圖軟體系統。

主要優點如下:資料儲存和處理系統、陣列運算工具(其向量、矩陣運算方面功能尤其強大)、完整連貫的統計分析工具、優秀的統計製圖功能

簡便而強大的程式語言:可操縱資料的輸入和輸出,可實現分支、迴圈,使用者可自定義功能

與其說R是一種統計軟體,還不如說R是一種數學計算的環境,因為R並不是僅僅提供若干統計程式、使用者只需指定資料庫和若干引數便可進行一個統計分析。

R是一個免費的自由軟體,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的。在R主頁那兒可以下載到R的安裝程式、各種外掛程式和文件。在R的安裝程式中只包含了8個基礎模組,其他外在模組可以透過CRAN獲得。

四、SPSS

SPSS是世界上最早的統計分析軟體。

主要優點如下:、操作簡便、程式設計方便、功能強大、資料介面、模組組合、針對性強:

五、Python

Python是一種物件導向、解釋型計算機程式設計語言。Python語法簡潔而清晰,具有豐富和強大的類庫。它常被暱稱為膠水語言,能夠把用其他語言製作的各種模組(尤其是C/C++)很輕鬆地聯結在一起。

常見的一種應用情形是,使用Python快速生成程式的原型(有時甚至是程式的最終介面),然後對其中有特別要求的部分,用更合適的語言改寫,比如3D遊戲中的圖形渲染模組,效能要求特別高,就可以用C/C++重寫,而後封裝為Python可以呼叫的擴充套件類庫。需要注意的是在您使用擴充套件類庫時可能需要考慮平臺問題,某些可能不提供跨平臺的實現。

主要優點如下:簡單、易學、速度快、高層語言、可移植性、解釋性


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31501076/viewspace-2653440/,如需轉載,請註明出處,否則將追究法律責任。

相關文章