[Strata Data Conference培訓課程] Apache Spark高階實踐和原理解析
這幾年隨著大資料分析和機器學習等等在工業界中越來越廣泛的應用,越來越多的人選擇在大資料平臺比如Apache Spark之上構建大規模資料處理、分析和機器學習,以便利用大量原始資料和擴充套件架構。如何深入理解大資料關鍵技術並更好的運用它們?本次課程將結合當前大資料技術的浪潮和趨勢,為您介紹Apache Spark的高階實踐和原理解析,幫助您加深領會Apache Spark的精華設計思想,以及如何與流式分析、機器學習,深度學習等緊密結合,在資料採集,分析處理,特徵提取,機器學習等方面提供一致性和整合性的高階實踐。
您將學到什麼及如何應用之
Spark高階原理及如何在Spark上進行機器學習,以及如何使用英特爾最新開源的分散式深度學習庫在Spark上進行深度學習
本培訓適合您因為…
Spark高階設計原理及如何在Spark上進行機器學習深度學習
預備條件:
軟體開發人員及大資料工程師, 以及高階資料分析人員。學員需掌握使用Linux環境的基本技能,最好具備Spark以及機器學方面的基本知識或經驗:並能熟練使用至少一種指令碼程式語言,建議Scala,Python,或者熟悉其他語言譬如Perl或Ruby。
具體課程內容涉及到
Apache Spark 揭祕
Spark 設計揭祕
Spark shuffle
Spark memory management
Spark SQL 揭祕
什麼是Spark SQL
Spark SQL 特性
Spark SQL 工作原理
Spark Streaming
流資料
Spark Streaming 設計原理
如何實現高可用性
Machine learning on Spark
Scaling out ML algorithms on Spark
End-to-end machine-learning pipelines
Deep learning on Spark using BigDL
BigDL概述
在Spark上如何使用BigDL
本次課程是針對Spark中高階使用者的,對SPARK深度的原理解析和高階實踐分享,希望您具備一定的Spark 知識技能,並對流式分析及機器學習有一定的興趣或瞭解。最後希望此課程能幫助您加速Spark分析以及機器學習的實踐,為您的資料科學學習和工作開啟一頁新篇章。
關於導師
Carson Wang
Carson Wang is a big data software engineer at Intel, focusing on developing and improving new big data technologies. He is an active open source contributor to the Spark and Alluxio projects. Prior to Intel, Carson was an engineer at Microsoft working on cloud computing technologies.
俞育才
英特爾大資料架構師,Spark開源貢獻者。10年軟體開發經驗,熟悉大資料,流計算,儲存,虛擬化。曾幫助多家公司構建基於Spark的流處理方案。
Zhichao Li
利智超來自於Intel大資料技術團隊,專注於大資料分析領域, Spark contributor。他的同事和他致力於在Apache Spark平臺上開發分散式機器學習演算法,以滿足大資料背景下的機器學習需求。他還為這些分散式機器學習演算法在Intel平臺上進行優化,以及幫助Intel的客戶為他們的業務開發大資料分析程式。
Yiheng Wang
Yiheng Wang is a software development engineer on the Big Data Technology team at Intel who works in the area of big data analytics. He and his colleagues are developing and optimizing distributed machine-learning algorithms (e.g., neural network and logistic regression) on Apache Spark. He also helps Intel customers build and optimize their big data analytics applications.
Daoyuan Wang
王道遠,英特爾亞太研發有限公司資深軟體工程師,自2014年起參與Spark SQL開發,是Apache Spark開源社群的活躍貢獻者。在參與Spark開發之前,他參與了IDH版本Hive的開發。譯有《Spark快速大資料分析》一書。
Strata Data Conference北京站正在報名中,點選圖片中二維碼可登入會議網站,瀏覽截止到目前為止的講師名單和已經確認的議題,早期票價優惠期截止到6月9日,儘快註冊以確保留位。
相關文章
- Strata + Hadoop World 2天培訓課程Hadoop
- NoSQL高階培訓課程-HBase&&MongoDB(兩天版)SQLMongoDB
- [Strata Data Conference培訓課程] 資料科學精髓:網際網路金融例項-量化線上金融信用與欺詐風險的評估資料科學
- 中科信ANSYS高階疲勞分析技術培訓課程
- Strata Data Conference Beijing教學輔導課 [報告廳議題介紹]
- Oracle高階培訓 第5課 學習筆記Oracle筆記
- Oracle高階培訓 第6課 學習筆記Oracle筆記
- Oracle高階培訓 第7課 學習筆記Oracle筆記
- Strata Data Conference Beijing教學輔導課 [多功能廳2議題介紹]
- Apache Flink 進階(三):Checkpoint 原理解析與應用實踐Apache
- 網路安全高階培訓
- FPGA/CPLD開發培訓課程FPGA
- Strata Data Conference Beijing教學輔導課 [多功能廳8A+8B議題介紹]
- Strata Data Conference Beijing教學輔導課 [多功能廳5B+C議題介紹]
- Spark Streaming高階特性在NDCG計算實踐Spark
- 武漢專場|第二期《資料安全實踐專題培訓》課程即將開課
- oracle高階效能調整培訓pptOracle
- Abaqus熱分析高階課程
- 參加UI培訓課程學什麼UI
- Apache Spark SQL的高階Join連線技術ApacheSparkSQL
- 課程實踐(二)
- 課程實踐(一)
- 西湖邊 課堂前|《資料安全實踐專題培訓》即將開課
- SAP Cloud for Customer 標準培訓課程Cloud
- Python開發培訓課程都學哪些Python
- 分享Cloudera大資料培訓課程的資訊Cloud大資料
- 不同級別程度的SAP培訓課程和PA認證分析
- Spark 以及 spark streaming 核心原理及實踐Spark
- 【全新課程】正點原子《ESP32物聯網專案實戰》培訓課程上線!
- 專案管理培訓實踐心得專案管理
- 紅帽和NIIT在中國攜手推出線上培訓課程,加速開源人才培養
- Oracle資料倉儲高階課程Oracle
- 學習Linux開發課程需要培訓嗎Linux
- MySQL DBA專案實戰系列培訓課程【MySQL 8.4最新版】MySql
- 長沙Java培訓:Java基礎通往高階進階篇Java
- 課程實踐(二)續
- 課程實踐(一)續
- 教程:Apache Spark SQL入門及實踐指南!ApacheSparkSQL