學習資料科學的五大免費資源

磐創AI發表於2018-12-17

學習資料科學的五大免費資源

作者 | 雅文

編輯 | 安可

出品 | 磐創AI技術團隊

大約三年前,我作為商業智慧分析師在Excel電子表格中執行大部分分析工作。我長期以來一直對學習編碼感興趣,之前曾經工作了幾年,用PHP和HTML構建網站。隨著時間的推移,我對資料科學產生了濃厚的興趣,並決定研究一些線上課程,學習該領域的一些技能。

一旦我開始,我就愛上了這個領域,並且已經培養成資料科學的角色。我很幸運能夠在日常工作中使用python來執行復雜的分析,並構建和部署機器學習模型。我在全職工作期間實現了這一目標,成本非常低(我估計這個成本不到500美元),而且沒有在該領域接受任何正規教育。

我堅信通過實踐方法學習,並且在過去幾年中,通過反覆試驗發現了一些適合我學習風格的奇妙資源。我想在這裡分享我學習資料科學的五大免費資源。

1)Kaggle(https://www.kaggle.com/)

當大多數人想到Kaggle時,通常會想到的是高利潤,可能是具有高價值獎品的恐嚇競賽。然而,Kaggle遠不止於此,我發現它是學習資料科學的絕佳工具。以下是Kaggle作為一個很好的資源的3個原因。

學習資料科學的五大免費資源

  • 資料集  Kaggle擁有大量免費資料集,其中包含我能想到的幾乎所有型別的資料。這些可用於練習資料探索,機器學習或深度學習技能。有一些眾所周知的高度預測資料集,例如著名的泰坦尼克號生存資料,這些資料非常適合實施資料清理,演算法優化和特徵工程。

  • 核心  Kaggle有一個很棒的社群,並且作為Kaggle社群成員的一部分,定期釋出核心(基本上是瀏覽器託管的jupyter筆記本),介紹他們的資料問題方法。閱讀這些內容並進行實驗可以真正幫助您擴充對資料科學的理解。除此之外,核心還允許您在瀏覽器中執行Jupyter筆記本,因此您可以練習python資料分析和機器學習,而無需在計算機上本地設定環境。

  • 課程   Kaggle還有一個專門用於免費課程的網站部分。其中包括對python,機器學習,資料視覺化等的介紹。它幾乎涵蓋了開始學習資料科學所需的基礎知識。

2)Dataquest

(https://www.dataquest.io/dashboard)

現在我非常喜歡那些主要由瀏覽器編碼組成的課程。Dataquest是迄今為止我在過去幾年中所採取的最佳方法。從技術上講,它並非完全免費。免費計劃為您提供25個免費任務,包括python程式設計初學者課程和Kaggle比賽課程。要訪問完整的資料科學課程,您可以按月或按年訂閱(我在6個月內使用晚上和週末完成課程,每週花費大約10-15個小時,每月訂閱費用約250美元)。

學習資料科學的五大免費資源

圖一 Dataquest上的學習環境示例

我非常喜歡學習方法和材料。它的全面之處在於它涵蓋了python程式設計到中級,pandas,numpy,sci-kit學習庫,Github和命令列。 它還在每個任務結束時指導專案,讓您練習所學的技能。

3) Anaytics Vidhya 

(https://www.analyticsvidhya.com/)

像Kaggle一樣,這個網站有許多不同的學習資料科學的領域。有一個很棒的部落格,他們定期釋出涵蓋R和python的文章和教程。我已經完成了許多教程,它們既全面又易於理解。分析Vidhya還經常執行黑客馬拉松,這使您可以訪問資料集和業務問題,您可以應用所學的技能。它們在該領域也存在一些實踐問題,這些問題包含相對簡單的資料集,並且具有高度可訪問性。作為機器學習的相對新手,我在貸款預測問題上排名前五。這裡還有一些免費的學習途徑,包括學習資料科學python的綜合指南。

4) Chris Albon (https://chrisalbon.com/)

這個網站有很多非常簡單的教程,從機器學習到統計到軟體工程,幾乎涵蓋了資料科學的各個方面。由於易於掃描,我幾乎每天都會參考這個網站來快速回答這些問題,我如何在Python中做到這一點?鍵入問題。 Chris還建立了一組解釋機器學習中的關鍵概念的卡片,他通過網站以12美元的價格出售這些卡片,但他也經常在推特上釋出這些卡片。 DemetriPananos收集了所有這些並將它們放在他的github回購中。我發現這些是快速攝取金鑰的一種非常有用的方法機器學習演算法的數學和統計基礎。

學習資料科學的五大免費資源


5)Fast.ai  (http://www.fast.ai/)

是我遇到的最好的免費深度學習課程。這是一個為期七週的課程,完全沒有廣告,但確實需要一些以前的編碼經驗。它是通過一系列視訊教授的,它還包括一組筆記本,其中包含材料中涵蓋的所有程式碼,因此您可以輕鬆地嘗試演算法。儘管如此,這門課程本質上非常實用,因為在討論解決方案背後的數學之前,它涵蓋了實際實施。

在過去的幾年裡,我使用了許多其他資源,但這些是我學到的最多的地方。 他們為我提供了良好的知識基礎。現在我將很多這些新技能付諸實踐,我仍然經常重訪這些網站,以進一步增強我的理解,並在遇到問題時解決問題。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31555081/viewspace-2285471/,如需轉載,請註明出處,否則將追究法律責任。

相關文章