1、主要學習hadoop中的四大框架:hdfs、mapreduce、hive、hbase。這四大框架是hadoop最最核心的,學習難度最大的,也是應用最廣泛的。
2、熟悉瞭解hadoop基本知識及其所需要的知識例如java基礎、linux環境、linux常用命令
3、hadoop一些基本知識:hadoop HDFS檔案系統的特徵、Map/Reduce、Hadoop mapper類的閱讀、Hadoop reducer類的閱讀、Mapreduce shuffle和排序
4、hadoop部署方式為單機模式、偽分散式、完全分散式。對單機模式大家可以不用去關心和學習,在學習中我個人建議是搭建偽分散式,完全分散式是生產環境中使用,當大家把偽分散式後,必須對完全分散式有所瞭解。
5、瞭解 Hadoop 各個釋出版的特性以及穩定性,選擇適合自己學習的穩定性版本。
6、環境搭建完畢後,安裝完成後需要一些基本的練級:hadoop shell命令。
7、有了基礎性的學習後,這時候是比較適合找本書來系統性的學習hadoop==》Hadoop權威指南(第2版)
以上部分參考於:Hadoop新手學習指導