從簡單到複雜:Apache Kafka應用例項詳解

OReillyData發表於2017-04-13

講師:Jiangjie Qin (linkedin corp)

09:00–12:30 週四, 2017-07-13

資料工程和架構

地點: 多功能廳8A+8B

觀眾水平:中級


必要預備知識

觀眾需要對資料基礎架構有基本瞭解。演講本身會盡可能由淺入深。


您將學到什麼

觀眾將會學習如何使用合理使用Kafka來解決實際需求。


描述

1. Apache Kafka簡介

1.1 Kafka的基本概念(Topic,Partition,Offset)

1.2 Kafka的資料生命週期(Producer,Broker,Consumer)

1.3 Kafka的特性(high throughput,low latency,persistency,replication)

1.4 Kafka的功能介面


2. Kafka的應用例項

2.1 資料流水線

2.2 流處理(如果Kafka 0.11在演講時已釋出將會介紹transaction support)

2.3 資料庫備份

2.4 CDC


3. Kafka的運維

3.1 如何判斷一個Kafka Cluster是否健康(核心指標)

3.2 如何對Kafka Cluster進行效能分析

3.3 LinkedIn的Kafka運維工具


講師介紹

Jiangjie Qin (linkedin corp)


Jiangjie Qin is from data infrastructure team at LinkedIn. He has been working on Apache Kafka and is a Kafka Committer. Jiangjie graduated from CMU with Master’s degree in Information Networking from INI in 2014. Before that, he worked in IBM for four years, where he managed IBM zSeries platform for banking clients.




Strata Data Conference北京站已經開啟註冊系統,閱讀原文可瀏覽截止到目前為止的講師名單和已經確認的議題,最優惠票價期截止到5月5日為止儘快註冊以確保留位

640?wx_fmt=png


相關文章