大資料的資料模型

OReillyData發表於2017-04-18

講師:Ted Malaska (Blizzard Entertainment )

09:00–12:30 週四, 2017-07-13

資料工程和架構, 英文講話 (Presented in English)

地點: 多功能廳5B+C

觀眾水平:Beginner


必要預備知識

Basic SQL


您將學到什麼

Basic understand of relational data models


描述

從Spark到Impala,再到Spark Streaming或Storm,分散式計算引擎最近的發展令人興奮。然而,如果你的設計僅僅只是專注於資料處理層並期望得到高速度和效能,那麼你可能就忽視了故事的另外一半,從而沒能用到很多的優化方法。

Ted Malaska關注於技術棧的下層,將會介紹一系列在Cassandra、HBase、Kudu、Kafka、SoIR、Elasticsearch、HDFS和S3上實現的儲存設計的模式和規劃。通過仔細地調整每種業務場景下資料儲存的方式,資料處理和訪問的時間可以降低兩到三個數量級。

你在本課程裡學習到的策略和原理可以被應用於很多的軟體環境。課程裡會展示使用HDFS、HBase、Cassandra、Kudu、Kafka、Elasticsearch和S3的例子。


講師介紹

Ted Malaska (Blizzard Entertainment)

Ted Malaska is a group technical architect on the Battle.net team at Blizzard, helping support great titles like World of Warcraft, Overwatch, and HearthStone. Previously, Ted was a principal solutions architect at Cloudera helping clients find success with the Hadoop ecosystem and a lead architect at the Financial Industry Regulatory Authority (FINRA). He has also contributed code to Apache Flume, Apache Avro, Apache Yarn, Apache HDFS, Apache Spark, Apache Sqoop, and many more. Ted is a coauthor of Hadoop Application Architectures, a frequent speaker at many conferences, and a frequent blogger on data architectures.




Strata Data Conference北京站已經開啟註冊系統,閱讀原文可瀏覽截止到目前為止的講師名單和已經確認的議題,最優惠票價期截止到5月5日為止儘快註冊以確保留位

640?wx_fmt=png


相關文章