Hadoop2.x運維實戰之入門手冊v1.0
Hadoop2.x運維實戰之入門手冊V1.0
1.常用元件介紹(體系結構+程式)
1.1HDFS
1.2MapReduce
1.3Yarn
1.4Hive
1.5Hbase
1.6Zookeeper
1.7Flume
1.8Kafka
1.9Sqoop
1.Hadoop2.6.0的偽分佈環境搭建
2.Hadoop-2.7.2+Zookeeper-3.4.6完全分散式環境搭建(HDFS,YARN HA)
3.Hadoop 2.x HDFS和YARN的啟動方式
4.Hadoop2.x常用埠及定義方法
5.Hadoop2.x常用命令
5.1學會怎樣檢視命令幫助
5.2hadoop fs
5.3hdfs dfs
5.4hdfs dfsadmin
5.5hdfs haadmin
5.6hdfs fsck
5.7yarn rmadmin
5.8其他命令
6.HDFS HA實戰
7.YARN HA實戰
8.動態新增DataNode(含NodeManager)節點(不修改dfs.replication)
9.新增DataNode節點後,更改檔案複製策略dfs.replication
10.動態刪除DataNode(含NodeManager)節點(修改dfs.replication)
11.Zookeeper實戰
12.Hive實戰
12.1 Hive+HDFS儲存資料+MySQL儲存後設資料搭建(本地模式)
12.2 Hive+HDFS儲存資料+MySQL儲存後設資料搭建(遠端模式)
12.3 HAProxy+Hive+HBase構建高可用資料探勘叢集
12.4 Hive Shell基本操作
12.5 Hive QL語法
12.6 資料匯入匯出
12.7 eclipse與Hive
13.HBase實戰
13.1 HMaster HA分散式搭建
13.2 HBase shell table常用命令
13.3 HBase shell 管理常用命令
13.4 eclipse與Hbase
14.Hadoop2.x DataNode資料均衡實戰
15.Hadoop2.x 效能調優
11.1作業系統
11.2JVM引數調優
11.3HDFS引數調優
11.4Yarn引數調優
11.5MapReduce引數調優
11.6Hive引數調優
16.Hadoop常見錯誤彙總
17.Hadoop常見運維技巧
18.參考資料
18.1運維記錄
18.2文件資料
19.作者心得
剛開始對大資料這塊完全屬於門外漢,然後在公司接下來的3個月裡搭建cdh4和cdh5環境,做做cdh5實驗(參照前輩的cdh4文件),記錄cdh5實驗過程,寫成文件!
在這個過程,其實很痛苦,因為我對這hadoop是啥也不懂,慢慢的,堅持下來,不懂就去Google,about 雲等等,當所有的實驗做下來,依舊對cloudera hadoop還是一頭霧水,只不過稍微開始慢慢的理解了,所以當時就慢慢的準備寫份“CDH5快速入門手冊v1.0”,在寫的過程的中,還不如說是在整理,我對CDH5理解的東西。可是CDH5太難搞懂了,因為它是對Apache Hadoop封裝的管理軟體,可能不想我們輕易瞭解CDH5的道道!
後來突然有一天,我想要去學Apache Hadoop,這個原生態的東西,於是乎,我在2016年1月3號,在Itpub開始寫部落格,當然之前我做開發的時候,就經常在新浪部落格上寫開發的東西(尤其是水晶報表實戰,後來莫名其妙基本每個禮拜都有qq加我,問我水晶報表各種其難雜症)!
自學2個多月了,是個痛苦的過程,突然有天晚上我靈感一抖,於是就寫下了當前的“Hadoop2.x運維實戰之入門手冊v1.0”大綱,當然這是個記錄自我學習的過程!
在當前目錄的實驗已做1/3了,xiao5預計在7月份左右,做完所有的實驗,寫成文件!期待吧!!!
等真正入門hadoop,我會繼續完善CDH5快速入門手冊v1.0!
加入群【cloudera hadoop】:258669058 不定期釋出資料的word文件、遇見的bug和心得!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30089851/viewspace-2048338/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- CDH5 快速入門手冊v1.0H5
- Hbase運維手冊運維
- redis運維手冊Redis運維
- 【ELK入門】Elastic中文社群運維監控實戰之架構篇AST運維架構
- Ansible之playbook的使用總結 - 運維手冊運維
- Redis入門手冊Redis
- Docker入門手冊Docker
- Linux運維命令重要嗎?運維入門Linux運維
- Redis運維實戰之叢集中的腦裂Redis運維
- shiro實戰系列(二)之入門實戰續
- selinux實戰手冊Linux
- 自動化運維工具之Puppet基礎入門運維
- mysql優化手冊v1.0MySql優化
- 【Linux】運維入門 -01Linux運維
- ORACLE基礎運維命令操作手冊Oracle運維
- MySQL入門學習之——實戰XtraBackupMySql
- MySQL入門學習之——實戰mysqldumpMySql
- [譯] Vue Router 實戰手冊Vue
- 網易OpenStack部署運維實戰運維
- JVM快速調優手冊v1.0JVM
- Java GUI入門手冊-AWT篇JavaGUI
- MxDraw雲圖快速入門手冊
- Frida官方手冊 - 快速入門
- MySQL運維4-Mycat入門MySql運維
- 想要學Linux運維怎麼辦?Linux運維入門Linux運維
- Flutter移動端實戰手冊Flutter
- jmeter 效能測試入門手冊分享JMeter
- React V16入門手冊(1)React
- React V16入門手冊(2)React
- BSD Socket 簡易入門手冊(轉)
- ansible自動化運維入門運維
- Kafka實戰-入門Kafka
- ElasticSearch實戰-入門Elasticsearch
- podman 入門實戰
- 學習Linux雲端計算有什麼發展方向?linux運維入門實戰Linux運維
- Java入門學習手冊之Eclipse常用快捷鍵彙總JavaEclipse
- Hadoop2.7實戰v1.0之YARN HAHadoopYarn
- Hadoop2.7實戰v1.0之HDFS HAHadoop