使用R和Apache Spark處理大規模資料 [session]

OReillyData發表於2017-05-26

講師:Xiaoyong Zhu (Microsoft)

11:15–11:55 Friday, 2017-07-14

資料科學&高階分析 (Data science & advanced analytics)

地點: 多功能廳5B+C

觀眾水平: 中級

必要預備知識

A basic understanding of R, Spark, and machine learning

您將學到什麼

Learn how to use R to analyze terabytes of data

描述

R是一個流行的用於資料分析的資料科學工具。然而它有不少的缺陷,比如它的記憶體使用問題以及單執行緒的設計。

本演講:

  • 我們會介紹微軟R伺服器的設計原則和架構,以及它和Apache Spark的整合。

  • 演示如何使用R伺服器來進行在Apache Spark上的可擴充套件的機器學習,以及使用R語言來分析T位元組級資料。


講師介紹

Xiaoyong Zhu (Microsoft)

640?wx_fmt=jpeg

Xiaoyong Zhu is a program manager at Microsoft focusing on scalable machine learning and advanced analytics.



Strata Data Conference北京站正在報名中,點選閱讀原文可登入會議網站。

注意:早期票價優惠期截止到6月9日儘快註冊以確保留位


640?wx_fmt=png


相關文章