為Hadoop上的大資料準備的統一的SQL

OReillyData發表於2017-04-19

講師:Xuefu Zhang (Software Engineer, Uber)

16:20–17:00 週六, 2017-07-15

資料工程和架構

地點:多功能廳6A+B

觀眾水平: Intermediate

議題


為Hadoop上的大資料準備的統一的SQL(Unified SQL for Big Data on Hadoop)

必要預備知識

SQL, Hadoop, Big Data

您將學到什麼

SQL on Hadoop, Query Processing, GeoSpacial UDFs

描述

在Uber,我們非常依賴從收集到的大資料裡學習司機和出行的資訊,並用來做每日的商業決策。諸如Apache Hive和Presto這樣的SQL工具被用於不同的業務場景,也包括像Vertica這樣的舊有資料倉儲。這些工具提供了相似但是不同的SQL句法,因此使用者經常會面對切換工具所帶來的挑戰。更重要的是,SQL使用者並不知道什麼是他們業務場景下正確的工具。每種引擎都有不同特點(優點和缺點),適用於不同的任務。如果選擇不恰當,查詢效能和資源的使用效率都會受影響。U-SQL是由Uber工程師內部開發的工具,希望能作為未來的SQL平臺,自動地解析、翻譯、優化和路由使用者用任何支援的查詢語言寫出的查詢,並提供一個統一的SQL介面給那些可能根本不熟悉底層SQL引擎的SQL使用者使用。


講師介紹


Xuefu Zhang(Uber)

Xuefu Zhang is a veteran in the open source communities and spends his main efforts on Apache Hive and Pig. 

He worked in the Hadoop team at Yahoo when the majority of the development on Hadoop was still there. In addition, he spent his early career at Informatica, gaining important experience on enterprise software development, especially in ETL and data warehousing. Prior to Uber, Xuefu was the tech lead for Hive at Cloudera and led a global effort in Hive on Spark project. Working for Uber since 2016, he is the tech/team lead for SQL on Hadoop. Xuefu Zhang is an Apache member, and PMC member for Hive, Sentry, and Pig.




Strata Data Conference北京站已經開啟註冊系統,閱讀原文可瀏覽截止到目前為止的講師名單和已經確認的議題,最優惠票價期截止到5月5日為止儘快註冊以確保留位

640?wx_fmt=png

相關文章