2018TOP100資料科學資源和工具(上)

格伯納發表於2018-11-02

無論您是剛開始從事資料科學,還是準備攻讀資料科學或商業分析碩士學位,都需要學習更多內容。本指南為所有階段的學習者收集了2018年網路上的頂級資料科學資源。  

2018TOP100資料科學資源和工具(上)


目錄

  • 線上課程和教程

  • 研究

  • 部落格

  • 電子書

  • 社群

  • 學位

  • 用R和Python編碼

  • 簡訊

  • 免費資料科學工具


線上課程和教程

Dataquest   - 那些對資料科學家,資料分析師或資料工程師感興趣的人可以通過互動式編碼挑戰來學習。學生可以處理問題並接觸到真正的資料科學專案。

(https://www.dataquest.io)

Udemy   - 被稱為世界上最大的線上學習市場,Udemy提供任何主題的數字自定進度課程。他們的資料科學選擇涵蓋從機器學習到資料視覺化到Python程式設計的所有內容。

(https://www.udemy.com/courses/search/?q=data%20science&src=ukw)

Coursera   - Coursera與世界各地的大學和機構合作,提供線上課程。註冊人可以訪問錄製的視訊講座,自動評分和同行評審作業以及社群討論論壇。

(https://www.coursera.org/browse/data-science)

DataCamp   - 對於希望提高技能的初學者和經驗豐富的專家來說,這個網站是一個很好的資源。DataCamp擁有與資料科學、統計學和機器學習相關的互動式R和Python課程。

(https://www.datacamp.com)

Udacity   - 在資料分析中獲得奈米級資料,從而開始資料科學的職業生涯。Udacity通過其課程提供測驗、視訊和動手實踐課程等互動內容。

(https://cn.udacity.com/dand)

EdX   - 該網站提供免費的線上資料科學課程,以培養您的技能並提升您的知識。通過edX上的頂尖大學和全球合作伙伴的課程學習資料科學、統計和商業智慧。

(https://www.edx.org/course/subject/data-science)

Cognitive Class   - 通過練習實驗室和視訊學習資料科學、人工智慧、大資料和區塊鏈的技能。認知課程還為國際使用者提供日語、西班牙語和俄語課程。

(https://cognitiveclass.ai)

Springboard   - 這個線上Bootcamp涵蓋了資料科學過程,從統計學到機器學習和用資料講故事。您可以專注於機器學習或NLP這樣的領域,並通過投資組合研究該計劃,以便進行面試。

(https://www.springboard.com/workshops/data-science-career-track?afmc=2h)

Data School(YouTube) - 此YouTube頻道屬於Kevin Markham,一位位於華盛頓特區的全職資料科學教育工作者。他的視訊涵蓋了一系列資料科學主題,如使用開源工具,Python和R。

(https://www.youtube.com/user/dataschool/featured)

Siraj Raval(YouTube) - Siraj Raval的YouTube頻道提供視訊,鼓勵和教育開發人員構建人工智慧。他建立了引人入勝的視訊,教導觀眾如何使用AI製作遊戲、音樂、聊天機器人、藝術等。

(https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A/featured)

IntelliPaat   - IntelliPaat教程涵蓋大資料、商業智慧和資料庫等主題。您可以向行業專家學習,並在成功完成課程後獲得認證。

(https://intellipaat.com/tutorials/)

Lynda   - 通過個人、企業、學術和政府訂閱,會員可以觀看Lynda在該領域的思想領袖教授的高質量視訊課程。您可以選擇課程持續時間和技能水平,以滿足您的專業需求。

(https://www.lynda.com/search?q=data+science)

Kaggle   - Kaggle非常適合想要在眾多資料科學專業中脫穎而出的初學者。您可以選擇機器學習、pandas、資料視覺化、R、SQL或深度學習中的軌道。

(https://www.kaggle.com/learn/overview)

TensorFlow   - TensorFlow是一款開源機器學習軟體。它的網站包含幾個關於如何將該程式用於幾個基本用途的深入教程。

(https://www.tensorflow.org/tutorials/estimators/cnn)


資料科學研究

社會福利資料科學 - 該網站由芝加哥大學資料科學與公共政策中心管理。它突出了非營利組織、政府組織和社會組織的社會有益資料科學專案。

(https://dssg.uchicago.edu/projects/)

國際資料科學與分析雜誌 - 該線上期刊歡迎資料科學和高階分析中的實驗和理論發現及其實際應用。這是資料科學和分析領域的第一本科學期刊。

(https://link.springer.com/journal/volumesAndIssues/41060)

CODATA資料科學期刊-   該線上期刊是開放獲取的,包括有關資料系統描述,實施及其出版物、應用程式等的論文。它特別關注開放資料的原則、政策和實踐。

(https://datascience.codata.org)

資料科學基礎白皮書 - 資料科學基金會提供由基金會成員撰寫的白皮書,並可供其他成員進行同行評審。閱讀有關該領域思想領袖的最新發現和觀點。利用免費的個人會員資格並參與社群活動。

(https://datascience.foundation/sciencewhitepaper)

IMB大資料和分析中心 - 這些白皮書遵循行業中大資料的最新趨勢。讀者可以訂閱在收件箱中的新報告和白皮書。

(https://www.ibmbigdatahub.com/whitepapers)

資料科學研究所 - 伯克利資料科學研究所的研究員分享了當今主要問題的資料密集型研究成果。該研究所有6個工作組,涉及工作文化和教育等主題。

(https://bids.berkeley.edu/research)

EPSRC博士培訓中心 - 該網站重點介紹了該中心目前的博士資料科學研究。學院致力於資料科學領域的研究,將理論與應用相結合。

(http://datascience.inf.ed.ac.uk/research/)


資料科學部落格

Edwin Chen的部落格   – Edwin在麻省理工學院學習數學和語言學,並在Clarium進行量化交易,在Twitter上做廣告,在Dropbox進行資料科學,在Google上進行統計/ ML。他的部落格提供有關人工智慧、人工計算和資料的深刻資訊。

(http://blog.echen.me)

DataScience.com

- DataScience.com部落格的文章適合資料科學、業務和IT團隊。專家們還有機會與成千上萬的網站讀者分享他們的見解。

(https://www.datascience.com/blog)

資料科學101   - Ryan Swanstrom擁有博士學位。專攻計算科學與統計學,自2012年以來一直在他的部落格上發表、分享有關資料科學的資源、新聞和研究。

(http://101.datascience.community)

The Shape of Data   - 雖然現在是谷歌的軟體工程師,傑西約翰遜開始擔任數學教授。他的部落格探索並解釋了現代資料分析的基本思想。

(https://shapeofdata.wordpress.com/about/)

Planet Big Data   - Planet Big Data彙集了有關大資料,Hadoop和相關主題的部落格。它涵蓋了全球博主的帖子。

(http://planetbigdata.com)

大資料部落格 - 會議本身介紹了大資料、可操作的見解和展示最佳實踐的最新發現。在部落格上,您可以找到有關這些主題的文章,這些文章可以節省您的會議之旅。

(http://blog.bigdataweek.com)

Chris Ablon的部落格 - Chris Ablon是一位資料科學家和政治學家,在統計、人工智慧和軟體工程方面擁有超過10年的經驗。他擅長政治、社會和人道主義工作,並就這些主題分享了數百個筆記。

(https://chrisalbon.com)

紐約資料學院部落格 - 這個部落格有關於R、網路抓取、機器學習和meetup的文章。它還概述了參與培訓計劃的一些頂級專案。

(https://nycdatascience.com/blog/)

DBMS2 -此部落格面向對資料庫和分析技術感興趣的人,並提供行業專業人士的評論。其作者Curt Monash已經關注該行業超過30年。

(http://www.dbms2.com)

Data36   - Tomi Mester的部落格深入瞭解了線上資料分析師的最佳實踐。您將找到有關資料分析、AB測試、研究和資料科學的文章、線上課程和視訊。

(https://data36.com)

運算元據庫管理系統 - 該站點是大資料、新資料管理技術和資料科學的資源門戶。該編輯是法蘭克福大學資料庫和資訊系統教授。

(http://www.odbms.org)

Yanir Seroussi的部落格 - Yanir Seoussi是一位經驗豐富的資料科學家和軟體工程師,在程式設計、電腦科學、機器學習和統計方面擁有豐富的背景。他的部落格包括從孤立資料問題到構建生產系統等主題的想法。

(https://yanirseroussi.com)

簡單統計 - 本部落格由三位生物統計學教授撰寫:Jeff Leek,Roger Peng和Rafa Irizarry。他們發表意見,為科學/流行寫作的討論做貢獻,連結到文章,並與嶄露頭角的統計學家分享建議。

(https://simplystatistics.org)

什麼是大資料? - Gil Press經營自己的諮詢業務gPress,提供寫作、研究和營銷服務。他的部落格探討了大資料對資訊科技、商業世界、政府機構和我們生活的影響。

(https://whatsthebigdata.com)

走向資料科學 - 這個部落格是成千上萬人交流思想和擴充套件我們對資料科學的理解的平臺。您可以從不同專業的資料科學家那裡閱讀各種各樣的想法。

(https://towardsdatascience.com)

Alexis Perrier的部落格 - Alexis Perrier是一名資料科學顧問,幫助大大小小的公司從機器學習中獲益。作為一名資料科學講師,他在部落格上分享了他對線性迴歸等重點知識的深入學習。

(https://alexisperrier.com)

Algobeans   - Algobeans由資料科學愛好者,劍橋大學的Annalyn和史丹佛大學的Kenneth建立。他們建立了該網站,以簡化的方式讓每個人都能訪問資料科學。

(https://algobeans.com)

Ben Frederickson的部落格 - Ben Frederickson是一位位於加拿大溫哥華的軟體開發人員。他在部落格上分享了軟體開發和資料科學的專案和發現。

(http://www.benfrederickson.com/blog/)

Daniel Nee的部落格 - Daniel Nee擁有機器學習和電腦科學的背景,並擔任資料科學家。他的部落格上有關於他的經驗、有用的工具和技術以及其他興趣的帖子。

(http://danielnee.com)

資料部落格 - 這個部落格整齊地按類別組織其帖子,如技術、自己動手和資料科學。還有一個問答部分,因此您可以詢問您可能遇到的任何資料科學問題。

(https://www.data-blogger.com/category/data-science/)

資料探勘研究 - Sandro Saitta在瑞士讀博士時開始寫這個部落格。部落格開始討論資料探勘的研究問題。現在帖子討論研究問題,最近的應用,重要的事件,對主要演員的採訪,當前的趨勢,書評和更多。

(http://www.dataminingblog.com)

Data Double Confirm   - Hui Xiang Chua在新加坡擔任研究分析師時,她不在部落格上分享知識。Data Double Confirm記錄了她在資料科學中的學習歷程,是資料收集、資料準備、資料視覺化和基本統計分析的重要資源。

(https://projectosyo.wixsite.com/datadoubleconfirm)

Data Meets Media   - 這個獨特的部落格融合了電視、電影和資料科學。 帖子分別涵蓋了兩個主題,並找到了所有主題之間的交集。

(http://datameetsmedia.com)

DataAspirant   - Saimadhu Polamuri是一位自學成才的資料科學家,資料科學教育家,也是DataAspirant的創始人。 此部落格是初學者的資料科學資源。

(https://dataaspirant.com)


資料科學電子書

資料科學家之旅 採訪超過20位令人驚歎的資料科學家 - 當作者Kate Strachnyi想要了解更多關於資料科學的知識時,她直接找到了源頭。在一系列20多次採訪中,她向領先的資料科學家詢問有關該領域的起點和行業未來的問題。

(https://www.amazon.com/Journey-Data-Scientist-Interviews-Scientists/dp/1548984248)

以艱難的方式學習Python   - 最新的Python 3更新,這是初學者最終學習如何編碼,儘管原始但仍然是最流行的方式。學習Python艱難的方法將你從絕對零到能夠閱讀和編寫基本的Python,然後瞭解其他關於Python的書籍。

(https://learnpythonthehardway.org)

O'Reilly免費資料科學圖書館 -該圖書館彙集了O'Reilly編輯、作者和Strata演講者在一個地方的最佳資料見解,因此您可以深入瞭解資料科學和大資料中發生的最新動態。

(https://www.oreilly.com/data/free/)

貝葉斯推理和機器學習 - 本書面向具有電腦科學、工程、應用統計學、物理學和生物資訊學背景的學生,他們希望獲得機器學習知識。作者使用外行人的術語和低水平的代數和微積分來介紹推理的基本概念。

(http://web4.cs.ucl.ac.uk/staff/D.Barber/textbook/091117.pdf)

資料探勘指南 - 這本免費的書採用邊做邊學的方法來解釋基本的資料探勘技術。資料探勘指南介紹了實用的資料探勘、集體智慧和建立推薦系統。

(http://guidetodatamining.com)

可解釋的機器學習 - 這本線上書籍是關於使機器學習模型及其決策可解釋的。它適用於機器學習從業者、資料科學家、統計學家和任何其他有興趣使機器決策更具人性的人。

(https://christophm.github.io/interpretable-ml-book/)

資料科學手冊 - 資料科學手冊彙集了25位有成就的資料科學家對他們的見解、故事和建議的深入訪談。雖然本書不是資料科學主題的教程,但它為各行各業提供了實用的職業洞察力。

(http://www.thedatasciencehandbook.com)

資料科學的藝術 - 本書描述了分析資料的過程。作者開發了管理資料分析師以及進行自己的資料分析的背景。

(https://leanpub.com/artofdatascience)

資料分析手冊 - 本手冊通過訪問資料科學行業最前沿的資料科學家、資料分析師、CEO、經理和研究人員,深入瞭解資料科學行業。

(https://www.teamleada.com/handbook)

Numsense!Layman的資料科學:沒有新增數學 - 正如標題所暗示的那樣,本書為所有背景的人打破了資料科學,省略了數學術語。有抱負的學生,有進取心的商業專業人士或其他渴望學習的人都可以找到教程和易於理解的解釋。

(https://www.amazon.com/Numsense-Data-Science-Layman-Added-ebook/dp/B01N29ZEM6)

D3提示和技巧v4.x   - 本書包含使用d3.js(第4版)的提示和技巧,d3.js是網路領先的資料視覺化工具之一。它旨在讓您開始並向邁進。

(https://leanpub.com/d3-t-and-t-v4)

R中的資料探勘演算法 - 那些瞭解程式語言R並希望瞭解有關資料探勘的更多資訊的人將受益於此WikiBook。瞭解演算法如何工作將有助於增加您對資料探勘的理解。

(https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R)

資料探勘技術:用於營銷、銷售和客戶關係管理,第3版 - 學習將資料探勘用於營銷或銷售目的。您將獲得有關提高直接營銷活動響應率,識別新客戶群和評估信用風險的建議。

(https://www.wiley.com/en-us/Data+Mining+Techniques%3A+For+Marketing%2C+Sales%2C+and+Customer+Relationship+Management%2C+3rd+Edition-p-9780470650936)


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31509949/viewspace-2218480/,如需轉載,請註明出處,否則將追究法律責任。

相關文章