[Strata Data Conference培訓課程] Apache Spark高階實踐和原理解析

OReillyData發表於2017-05-19

這幾年隨著大資料分析和機器學習等等在工業界中越來越廣泛的應用,越來越多的人選擇在大資料平臺比如Apache Spark之上構建大規模資料處理、分析和機器學習,以便利用大量原始資料和擴充套件架構。如何深入理解大資料關鍵技術並更好的運用它們?本次課程將結合當前大資料技術的浪潮和趨勢,為您介紹Apache Spark的高階實踐和原理解析,幫助您加深領會Apache Spark的精華設計思想,以及如何與流式分析、機器學習,深度學習等緊密結合,在資料採集,分析處理,特徵提取,機器學習等方面提供一致性和整合性的高階實踐。


您將學到什麼及如何應用之

Spark高階原理及如何在Spark上進行機器學習,以及如何使用英特爾最新開源的分散式深度學習庫在Spark上進行深度學習

本培訓適合您因為…

Spark高階設計原理及如何在Spark上進行機器學習深度學習

預備條件:

軟體開發人員及大資料工程師, 以及高階資料分析人員。學員需掌握使用Linux環境的基本技能,最好具備Spark以及機器學方面的基本知識或經驗:並能熟練使用至少一種指令碼程式語言,建議Scala,Python,或者熟悉其他語言譬如Perl或Ruby。



具體課程內容涉及到

Apache Spark 揭祕

  • Spark 設計揭祕

  • Spark shuffle

  • Spark memory management

Spark SQL 揭祕

  • 什麼是Spark SQL

  • Spark SQL 特性

  • Spark SQL 工作原理

Spark Streaming

  • 流資料

  • Spark Streaming 設計原理

  • 如何實現高可用性

Machine learning on Spark

  • Scaling out ML algorithms on Spark

  • End-to-end machine-learning pipelines

Deep learning on Spark using BigDL

  • BigDL概述

  • 在Spark上如何使用BigDL

本次課程是針對Spark中高階使用者的,對SPARK深度的原理解析和高階實踐分享,希望您具備一定的Spark 知識技能,並對流式分析及機器學習有一定的興趣或瞭解。最後希望此課程能幫助您加速Spark分析以及機器學習的實踐,為您的資料科學學習和工作開啟一頁新篇章。


關於導師


Carson Wang

640?wx_fmt=jpeg

Carson Wang is a big data software engineer at Intel, focusing on developing and improving new big data technologies. He is an active open source contributor to the Spark and Alluxio projects. Prior to Intel, Carson was an engineer at Microsoft working on cloud computing technologies.


俞育才

640?wx_fmt=jpeg

英特爾大資料架構師,Spark開源貢獻者。10年軟體開發經驗,熟悉大資料,流計算,儲存,虛擬化。曾幫助多家公司構建基於Spark的流處理方案。


Zhichao Li

640?wx_fmt=jpeg

利智超來自於Intel大資料技術團隊,專注於大資料分析領域, Spark contributor。他的同事和他致力於在Apache Spark平臺上開發分散式機器學習演算法,以滿足大資料背景下的機器學習需求。他還為這些分散式機器學習演算法在Intel平臺上進行優化,以及幫助Intel的客戶為他們的業務開發大資料分析程式。


Yiheng Wang

640?wx_fmt=jpeg

Yiheng Wang is a software development engineer on the Big Data Technology team at Intel who works in the area of big data analytics. He and his colleagues are developing and optimizing distributed machine-learning algorithms (e.g., neural network and logistic regression) on Apache Spark. He also helps Intel customers build and optimize their big data analytics applications.


Daoyuan Wang

640?wx_fmt=jpeg

王道遠,英特爾亞太研發有限公司資深軟體工程師,自2014年起參與Spark SQL開發,是Apache Spark開源社群的活躍貢獻者。在參與Spark開發之前,他參與了IDH版本Hive的開發。譯有《Spark快速大資料分析》一書。




Strata Data Conference北京站正在報名中,點選圖片中二維碼可登入會議網站,瀏覽截止到目前為止的講師名單和已經確認的議題,早期票價優惠期截止到6月9日儘快註冊以確保留位

640?wx_fmt=png


相關文章