大資料學習資源之DataCamp

金豆資料工程師發表於2019-02-14

《Nature》雜誌早在2008年第一次提出“Big Data”的概念,到2015年國務院正式印發《促進大資料發展行動綱要》,標誌著大資料正式上升至國家戰略,再到2017年的大資料市場全面開啟,各省市積極響應中央號召,大資料行業出現井噴之勢。

 

與大資料緊密相關的教育行業當然也不甘落後,各類培訓認證課程也如雨後春筍般席捲各大網路平臺,真可謂是“迅雷不及掩耳盜鈴”。(逃...(ૢ˃ꌂ˂ૢ))

 

今天來給大家簡單介紹一個免費的大資料學習資源平臺——DataCamp

 在這裡相信有許多想要學習大資料的同學,大家可以+下大資料學習裙: 740041381,即可免費領取套系統的大資料學習教程

 

從名字組成就可以得知,Data Camp (Campus) —— “資料校園”。官網對於DataCamp的官方介紹為 :

 

“DataCamp offers interactive R, Python, Sheets, SQL and shell courses. All on topics in data science, statistics and machine learning. Learn from a team of expert teachers in the comfort of your browser with video lessons and fun coding challenges and projects.” 

“DataCamp提供了互動式的R,Python,Sheets,SQL,和Shell的課程,覆蓋了資料科學,統計學和機器學習上的所有話題。通過視訊課程,有趣的程式設計挑戰和專案,來從一組專家團隊中學習。”

 

我是在剛剛搜資料時無意間進入到這個社群的,最初是被它吸引的是網站簡潔的版面設計和清晰的框架構成。可以從首頁清晰的找到課程-Courses,開啟後可以看到將資料科學按工具技術和研究領域的不同模組進行了細分。

 

 

點選R語言模組,可以看到裡面包含了近200門R語言的課程,並且把每門課程對應的授課老師,職位和研究領域都進行了標註。我們點選第一門課程“Introduction to R”。

開啟後可以看到R語言介紹這門課程對應的章節目錄,試驗了半小時,完成了幾個測試後,發現每完成一個章節,系統都會自動記錄課程整體完成進度和累計的經驗值。

而具體到每一節課程練習的形式是如下這樣,包括練習的題目,指導,虛擬的R語言程式設計和執行環境。通過題目完成每一道題目的要求,執行程式碼後提交結果,來考核自己的完成情況。

 

除了開頭提到的模組版式和佈局,另一個吸引我的亮點就是互動式的學習環境,相比於在本地環境下,對照著視訊課程和書本,不斷的build,run和debug,這種互動式的學習方式可以很好地幫助我們,擺脫過程中的枯燥乏味,就像有一個虛擬線上的老師,每一步的操作有什麼問題,都會及時的提醒你改正,並給予專業而正確的指導。

 在這裡相信有許多想要學習大資料的同學,大家可以+下大資料學習裙: 740041381,即可免費領取套系統的大資料學習教程

除了課程和練習資源,我們還可以通過DataCamp下載到不同資料工具的速查手冊,手冊可以幫助我們在實際的專案中,快速檢索並鎖定解決方案。以下擷取三張R語言的速查表:

 

data.table is an R package that provides a high-performance version of base R’s data.frame with syntax and feature enhancements for ease of use, convenience and programming speed:

 

 

The tidyverse is a powerful collection of R packages that are actually data tools for transforming and visualizing data. All packages of the tidyverse share an underlying philosophy and common APIs.

 

 

eXtensible Time Series (xts) is a powerful package that provides an extensible time series class, enabling uniform handling of many R time series classes by extending zoo: 

 

 

總結:知識是學不完的,工具也是不斷更新優化的,保持一顆接受變化的心,去擁抱大資料帶來的挑戰。曾經有人告訴我,最好的學習方法不是系統學習後再去實踐,而是在實踐過程中查漏補缺。當然,我覺得呢,因人而異,後者可能時間上更短,但前者掌握的更深更全面。具體情況,具體分析,能選擇最適合自己,最能解決當下和長遠問題的方案最好。

 

關於DataCamp,暫時沒辦法給大家帶來更多的介紹了,因為我也才是剛剛註冊賬號使用了半小時而已。不過我已經新增到了收藏夾,待我解決了當下的問題,後面再來詳細的總結DataCamp的學習內容。

 

祝好~

相關文章