Strata Data Conference Beijing教學輔導課 [多功能廳8A+8B議題介紹]

OReillyData發表於2017-04-13

從簡單到複雜:Apache Kafka應用例項詳解


1. Apache Kafka簡介

1.1 Kafka的基本概念(Topic,Partition,Offset)

1.2 Kafka的資料生命週期(Producer,Broker,Consumer)

1.3 Kafka的特性(high throughput,low latency,persistency,replication)

1.4 Kafka的功能介面


2. Kafka的應用例項

2.1 資料流水線

2.2 流處理(如果Kafka 0.11在演講時已釋出將會介紹transaction support)

2.3 資料庫備份

2.4 CDC


3. Kafka的運維

3.1 如何判斷一個Kafka Cluster是否健康(核心指標)

3.2 如何對Kafka Cluster進行效能分析

3.3 LinkedIn的Kafka運維工具



現代流計算架構


Twitter的所有應用都是實時的。由於對於實時性的高要求,Twitter在過去幾年的時間內投入人力和研發了一整套實時資料技術棧。最近,越來越多的企業對於實時資料技術架構感興趣。從批處理向流計算機構的轉型,是企業關於如何使用資料的一次技術革命。但是,實時資料技術棧(包括流計算引擎、資料儲存引擎、程式語言和工具)的最前沿現狀又是什麼呢?在這其中,又有哪些技術挑戰?以及這些前沿技術怎麼影響流計算的架構和應用呢?


本輔導課將會介紹:

- 流計算的簡介,以及一些典型應用

- 流計算架構是什麼?

- 不同型別的流計算架構和他們的優缺點

- 詳細討論為實時資料儲存設計的Apache DistributedLog,以及它在現代實時資料技術棧裡的使用場景

- 詳細討論流計算引擎Heron,以及它在現代實時資料技術棧裡的使用場景

- Twitter在使用Apache DistributedLog和Heron來搭建實時資料技術棧時獲得的經驗教訓。




Strata Data Conference北京站已經開啟註冊系統,閱讀原文可瀏覽截止到目前為止的講師名單和已經確認的議題,最優惠票價期截止到5月5日為止儘快註冊以確保留位

640?wx_fmt=png


相關文章