資料分析 | 零基礎入門資料分析(一):從入門到摔門?

weixin_34320159發表於2018-06-21

大家好,我是計算機白痴娜。o(〃'▽'〃)o

大概三四個月前的某個晚上,娜娜醬我正癱在沙發上美滋滋地玩著手機聽著歌,忽然心頭一緊:為什麼網易雲音樂的每日推薦歌單這麼瞭解我的喜好?然而我卻對這些每天推薦我們聽什麼、看什麼、吃什麼、買什麼的App背後的資料世界一無所知?這個“想要在資料和演算法的海洋裡盪漾”的想法是如此強烈,以至於我最終竟然一步步走上了自學資料分析的歧途……

可我只會重啟試試啊!(☄⊙ω⊙)☄

不過這怎麼難得倒我足智多謀娜某人,一波花式搜尋之後,果然搜到了一堆關於如何零基礎自學資料分析的文章,但是定睛一看:滾吶 (っ °Д °;)っ!人家根本就不是零基礎好嗎!要不就是有計算機背景,會Java/C/C++等等各種我連名字都拼不起的語言,要不就是統計學出身的學霸,甚至還有正在讀Data Analysis專業的大神推薦了一大波資料分析師必讀書……(驚慌失措娜娜醬.jpg)

2454496-ca9e43787371306a.png

1.作為還沒有過來的過來人給小夥伴們做個心理建設吧:

怎麼說呢,一個坑都不想踩,半米彎路都不想走,指望順著別人的經驗從原點筆直地抵達終點的好事是不存在的,最重要的是趕緊開始and投入時間,前期什麼都搜一點看一點學一點,過段時間差不多就摸到適合自己的路子了。就像很多人糾結做資料分析到底用R還是用Python,不知道選哪個所以遲遲無法開始怎麼辦?都去嘗試一下啊!!不約出來了解一下怎麼知道自己到底喜歡哪個姑娘呢!!這裡沒有任何程式設計基礎的娜醬都學了一下發現python更好上手所以最終決定學python。事實上這兩個工具各有利弊,大神們已經分析出一大堆了不贅述了,選自己喜歡的。

2.心理建設的差不多了,可以開始入門了,但是學什麼以及怎麼學呢?

目標導向,想做個資料分析師,有兩個基礎很重要:行業業務sense和分析技能。行業經驗沒辦法,這也不是朝夕之間直接能學會的東西,所以主要還是學分析技能,這裡又有兩方面:一方面是統計知識基礎,另一方面是資料分析技能(Excel/SAS/SQL/Python/R等等)。兩個方面的學習可以同時開始。

對於像我這樣耐性很渣的小夥伴來說,入門著實不推薦看書自學,生活已經好艱難了,我們就不要逼自己做這種很難堅持的事情了。ಠ_ಠ

(1)統計學基礎:現在網路課程平臺很多,統計學基礎知識隨便哪個平臺上的數理統計課程作為入門就好。以後用到什麼再有針對性的補充。推薦兩個:

網易雲課堂:概率論與數理統計,南京大學

老師講解很細緻很紮實,統計部分結合瞭如何用python實現

Coursera:Basic Statistics,University of Amsterdam

舉例非常生動,缺點是需要科學上網,並且對英語有一點點要求

(2.1)SQL:

w3schools.com(大概過了一遍基本的語句,熟悉一下操作)

(2.2)Python:

Coursera: Python for Everybody,University of Michigan

這是Coursera的專項課程,一共五門,前兩門可以作為入門,缺點還是需要科學上網

實驗樓:NumPy 使用教程

用Python語言進行資料分析就一定會接觸到NumPy。NumPy是支援Python語言的數值計算擴充庫,其擁有強大的高維度陣列處理與矩陣運算能力。

實驗樓:Pandas 使用教程  &  實驗樓:Pandas百題大沖關

瞭解了NumPy之後接下來就可以學習更強大的Pandas了,Pandas是基於NumPy的資料處理工具,我們可以通過它完成對資料集進行快速讀取、轉換、過濾、分析等一系列操作。除此之外,Pandas擁有強大的缺失資料處理與資料透視功能,是資料預處理中的必備利器。

實驗樓:使用 Matplotlib 繪圖

Matplotlib是支援Python語言的開源繪相簿,支援豐富的繪圖型別,有著簡單的繪圖方式以及完善的介面文件。過程分析中出圖基本都靠Matplotlib了。

以上推薦都是免費就可以學習到的內容,為了對錢包稍微狠心一點娜娜選擇了網易雲課堂的資料分析師(python)微專業,主要是感覺這樣一整套學比較系統,算是花錢買時間了,目前還在打怪升級中~另外DataCamp也很推薦~最後,給不看書不舒服斯基的小夥伴推薦這一本書:《利用Python進行資料分析》。這本書可以說是資料分析入門必讀書,主要介紹了Python的3個庫Numpy(陣列),Pandas(資料分析)和Matplotlib(繪圖)。目前國內的中文版的程式碼是基於Python2.7的,有些程式碼已經不能執行了。英文版的已經更新為3.0了,所以有條件建議看英文版。(如果有需要的話可以私下找我分享那個啥)

2454496-8ea83a9eeac502dc.png
《Python for Data Analysis》  

學完這幾部分內容,娜姐我這就算是從資料幼兒園通關了!暫時還沒有摔門!分享一點小小的心得:不要有做事必須完美無缺的強迫症,不需要在小細節上一直糾結浪費時間,要記得重點是把這一套知識結構搭起來,後面缺了東西查漏補缺就好,放鬆~也許前面不會的東西看到後面自然而然就解決了呢。後續娜娜醬會把自己在微專業上做過的一些小作業分享出來,請期待~

這是零基礎入門資料分析系列的第一篇,可能你也會對《資料分析,從入門到放棄》感興趣。

2454496-0759d5fff2cd9e30.png
(-'๏_๏'-)謝謝您閱讀,請勿轉載。

相關文章