Hadoop應用的架構:欺詐檢測

OReillyData發表於2017-04-18

講師:Ted Malaska (Blizzard Entertainment )

13:30–17:00 週四, 2017-07-13

Hadoop核心&發展, 英文講話 (Presented in English)

地點: 多功能廳5B+C

觀眾水平:Intermediate


必要預備知識

The tutorial will include a live demo of the full project on Cloudera's QuickStart VM. The code for the demo is available on GitHub. Download it here to follow along.


您將學到什麼

How to build a fraud-detection app on Hadoop


描述

設計實現一個可擴充套件、低延遲的架構需要廣泛瞭解各種框架,比如Kafka、HBase、HDFS、Flume、Spark、Spark Streaming和Impala等。好訊息是現在有非常充沛的資源(書籍、網站、會議等)來深入瞭解和這些專案相關的資訊。壞訊息則是對於如何整合這些部件並實現完整的解決方案的資訊卻是相當得匱乏。

Ted將會指導參會者搭建一個欺詐檢測系統,並使用一個端到端的案例研究作為一個具體的例子,展示如何使用Apache Hadoop元件(比如Kafka、HBase、Impala和Spark)來架構和實現一個實時系統。他會介紹架構設計實時應用的最佳實踐和考慮點,為那些已經瞭解Hadoop和熟悉分散式資料處理系統的開發人員、架構師或是專案領導提供如何利用Hadoop元件來實現實時應用的更多的洞察。

主題包括:

  • 在Kafka、HBase和Hadoop裡建立資料模型,併為資料選擇最優的儲存格式

  • 整合多個資料採集、處理和儲存系統

  • 收集和分析基於事件的資料,比如日誌、機器生成的資料,並在Hadoop裡儲存這些資料

  • 對資料做查詢和出報表


講師介紹

Ted Malaska (Blizzard Entertainment)

Ted Malaska is a group technical architect on the Battle.net team at Blizzard, helping support great titles like World of Warcraft, Overwatch, and HearthStone. Previously, Ted was a principal solutions architect at Cloudera helping clients find success with the Hadoop ecosystem and a lead architect at the Financial Industry Regulatory Authority (FINRA). He has also contributed code to Apache Flume, Apache Avro, Apache Yarn, Apache HDFS, Apache Spark, Apache Sqoop, and many more. Ted is a coauthor of Hadoop Application Architectures, a frequent speaker at many conferences, and a frequent blogger on data architectures.




Strata Data Conference北京站已經開啟註冊系統,閱讀原文可瀏覽截止到目前為止的講師名單和已經確認的議題,最優惠票價期截止到5月5日為止儘快註冊以確保留位

640?wx_fmt=png


相關文章