分享Cloudera大資料培訓課程的資訊

IRENE2007發表於2015-10-13

北京、上海、廣州、成都長期開班

【Cloudera Apache Hadoop程式設計師課程】
課時:4天
學習Hadoop分散式檔案系統(HDFS)基礎和MapReduce框架以及如何利用其API來編寫程式,
討論為更大型的工作流程而設計技術。
這門4天的課程涵蓋了為MapReduce程式修復漏洞和優化效能所需的高階技巧。
程式設計師課程也引入了Apache生態專案比如Hive、Pig、HBase、Flume和Oozie。
在完成課程後,學員被鼓勵參加Cloudera認證Apache Hadoop程式設計師(CCDH)考試。

【課程內容】
1、MapReduce與HDFS核心知識以及如何編寫MapReduce程式
2、Hadoop開發的最佳實踐,除錯、實現工作流及通用演算法
3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的元件
4、按需定製WritableComparables與InputFormats處理複雜的資料型別
5、利用MapReduce編寫、執行連線操作以整合不同資料集合
6、用於現實世界資料分析所需的高階HadoopAPI主題
7、用Java寫MapReduce程式,用Streaming寫MapReduce程式
8、除錯MapReduce程式碼的策略,利用localjobrunner在本地測試MapReduce程式碼
9、Partitioners和Reducers如何一起工作,定製化Partitioners
10、定製Writable和WritableComparable
11、用SequenceFile和Avro資料檔案儲存二進位制資料

【學員基礎】
該課程適合具有一定程式設計經驗的程式開發人員。由於課程中需要完成Hadoop相關程式設計練習,熟悉Java者優先

【授課形式】
案例教學+上機實踐


【Cloudera 資料分析課程】
課時:4天
針對任何需要在Hadoop上實時地通過SQL和熟悉的指令碼來管理、操縱和查詢大型複雜資料的人。
學習Apache Pig、Apache Hive和Cloudera Impala如何通過過濾聯接和其他使用者自定義的功能
來支援資料的轉型和分析。

【課程內容】
1、Hadoop生態圈、實驗場景介紹、用Hadoop工具匯入資料
2、pig的特性、使用案例、和pig互動、pig Latin語法、Field定義、用pig執行ETL流程
3、pig處理複雜資料,複雜/nested巢狀的資料型別、用pig分析廣告戰役的資料
4、pig的多資料組操作,pig連結多資料組、用pig分析離散的資料組
5、用流處理和UDFs擴充套件pig,Macros和Imports、contributed functions,用其他語言和pig一起處理資料
6、pig故障排查和優化,用web介面排查一個故障的任務、Data取樣和故障排查、理解執行計劃、提高pig任務效能
7、hive表結構和資料儲存、對比hive和傳統資料庫、hive vs.pig、hive使用案例
8、hive的關係資料分析、資料管理、文字處理、優化及擴充套件,在shell、指令碼和hue上執行hive查詢
9、impala和hive、pig、關聯式資料庫的不同、使用impala shell
10、取樣impala分析資料,過濾、排序and limiting results,提升impala效能,impala的互動式分析
11、對比map reduce、pig、hive、impala和關聯式資料庫

【學員基礎】
該課程適合有SQL經驗和基本UNIX和Linux命令的資料分析師、業務分析師和管理員
事先無需Java和Apache Hadoop的經驗

【授課形式】
案例教學+上機實踐


【諮詢方式】
電話:021-60491209、15000519329(陳老師),010-82526882(高老師) 

相關文章