CDH5 快速入門手冊v1.0
0. 體系架構
CM分為Server與Agent兩部分及資料庫(自帶更改過的嵌入Postgresql)。它主要做三件事件:
1. 管理監控叢集主機。
2. 統一管理配置。
3. 管理維護Hadoop平臺系統。
實現採用C/S結構,Agent為客戶端負責執行服務端發來的命令,執行方式一般為使用python呼叫相應的服務shell指令碼。Server端為Java REST服務,提供REST API,Web管理端透過REST API呼叫Server端功能,Web介面使用富客戶端技術(Knockout)。
1. Server端主體使用Java實現。
2. Agent端主體使用Python, 服務的啟動透過呼叫相應的shell指令碼進行啟動,如果啟動失敗會重複4次呼叫啟動指令碼。
3. Agent與Server保持心跳,使用Thrift RPC框架。
1. 相關目錄
· /opt/cloudera/parcels/ : Hadoop相關服務安裝目錄。
· /opt/cloudera/parcel-repo/ : 下載的服務軟體包資料,資料格式為parcels。
· /opt/cloudera/parcel-cache/ : 下載的服務軟體包快取資料。
· /opt/cloudera/parcels/CDH/jars : 所有jar包所在目錄
· /var/log/cloudera-scm-installer : 安裝日誌目錄
· /var/log/cloudera-scm-* : 相關日誌檔案(相關服務的及CM的)
· /usr/share/cmf/ : 程式安裝目錄
· /usr/lib64/cmf/ : Agent程式程式碼
· /var/lib/cloudera-scm-server-db/data : 內嵌postgresql資料庫目錄
· /var/lib/cloudera-scm-server:服務端目錄
· /usr/bin/postgres : 內嵌資料庫程式
· /etc/cloudera-scm-agent/ : cm agent的配置目錄。
· /etc/cloudera-scm-agent/config.ini : 配置連線服務端的配置,如server_host
· /etc/cloudera-scm-server/ : cm server的配置目錄。
· /etc/cloudera-scm-server/db.properties :database settings
· /etc/hadoop/* :hadoop客戶端配置目錄
· /etc/hive/ :hive 的配置目錄
2. 配置及環境變數
· CDH4/5配置檔案之深度解析: http://blog.itpub.net/30089851/viewspace-2110288/
CDH安裝完成後,服務啟動時,Hadoop各元件配置檔案會被放置於/var/run/cloudera-scm-agent/process/目錄下。
例如:/var/run/cloudera-scm-agent/process/193-hdfs-NAMENODE/core-site.xml。這些配置檔案是透過Cloudera Manager啟動相應服務(如HDFS)時生成的,內容從資料庫中獲得(即透過介面配置的引數)。
在CM介面上更改配置是不會立即反映到配置檔案中,這些資訊會儲存於資料庫中,等下次重啟服務時才會生成配置檔案。且每次啟動時都會產生新的配置檔案。
CM Server主要資料庫為scm/cmf中放置配置的資料表為configs。裡面包含了服務的配置資訊
每一次配置的更改會把當前頁面的所有配置內容新增到資料庫中,以此儲存配置修改歷史。
· 檢視配置內容
a.直接查詢cmf資料庫的configs資料表的內容。
b.訪問REST API:,返回JSON格 式部署配置資訊。
· 配置生成方式
CM為每個服務程式生成獨立的配置目錄(檔案)。所有配置統一在服務端查詢資料庫生成(因為scm/cmf資料庫只能在localhost下訪問)生成配置檔案,再由agent透過網路下載包含配置檔案的zip包到本地解壓到指定的目錄。
· 配置修改
CM對於需要修改的配置預先定義,對於沒有預先定義的配置,則透過在高階配置項中使用xml配置片段的方式進行配置。而對於/etc/hadoop/下的配置檔案是客戶端的配置,可以在CM透過部署客戶端生成客戶端配置。
· 環境變數指令碼:/opt/cloudera/parcels/CDH/meta/cdh_env.sh
CDH_HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop
HADOOP_BIN=/opt/cloudera/parcels/CDH/lib/hadoop-0.20-mapreduce/bin/Hadoop
#CM 客戶端/服務端、Hadoop各個元件的配置檔案都在/etc目錄下
HDFS
Active NameNode 資料目錄 dfs.name.dir
/dfs/nn
Standby NameNode 資料目錄 dfs.name.dir
/dfs/nn
Secondary NameNode HDFS 檢查點目錄fs.checkpoint.dir
/dfs/nn
日誌目錄hadoop.log.dir
/var/log/hadoop-hdfs
MapReduce
JobTracker 本地資料目錄mapred.local.dir
/mapred/jt
TaskTracker 本地資料目錄列表mapred.local.dir
/mapred/local
日誌目錄hadoop.log.dir
/var/log/hadoop-0.20-mapreduce
Hive
倉庫目錄hive.metastore.warehouse.dir
/user/hive/warehouse
HiveServer2 日誌目錄
/var/log/hive
Zookeeper
資料目錄dataDir
/var/lib/zookeeper
事務日誌目錄dataLogDir
/var/lib/zookeeper
3. CM常用命令
service cloudera-scm-server start|stop|restart|status
service cloudera-scm-server-db start|stop|restart|status
service cloudera-scm-agent start|stop|restart|status
檢視程式:jps / jps -l
4. Hadoop Shell
hadoop fs -ls /:列出hdfs檔案系統根目錄下的目錄和文件
hadoop fs -ls -R /:列出hdfs檔案系統所有的目錄和文件
hadoop dfsadmin –report : 檢視檔案系統的基本資訊和統計資訊
5. MapReduce
6. Yarn
7. Hive
8. Zookeeper
9. See
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/30089851/viewspace-1991862/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- MxDraw雲圖快速入門手冊
- Frida官方手冊 - 快速入門
- JVM快速調優手冊v1.0JVM
- 寫給新人的React快速入門手冊React
- Redis入門手冊Redis
- Docker入門手冊Docker
- 從安裝到入門:ElasticSearch 快速學習手冊Elasticsearch
- Hadoop2.x運維實戰之入門手冊v1.0Hadoop運維
- jQuery簡明參考手冊——30分鐘快速入門jQueryjQuery
- mysql優化手冊v1.0MySql優化
- JVM快速調優手冊v1.0之三:記憶體分配策略JVM記憶體
- XML輕鬆學習手冊(2)XML快速入門之二(轉)XML
- XML輕鬆學習手冊(2)XML快速入門之三(轉)XML
- Java GUI入門手冊-AWT篇JavaGUI
- JVM快速調優手冊v1.0之六:JVM引數設定、分析JVM
- JVM快速調優手冊v1.0之二:常見的垃圾收集器JVM
- Linux下的網路協議分析工具-tcpdump 快速入門手冊(轉)Linux協議TCP
- jmeter 效能測試入門手冊分享JMeter
- React V16入門手冊(1)React
- React V16入門手冊(2)React
- BSD Socket 簡易入門手冊(轉)
- Web安全開發規範手冊V1.0Web
- Web 安全開發規範手冊 V1.0Web
- pgpool-II 4.3 中文手冊 - 入門教程
- JVM快速調優手冊v1.0之四:堆記憶體分配的CMS公式解析JVM記憶體公式
- 安卓開發開發規範手冊V1.0安卓
- 安卓開發開發規範手冊 V1.0安卓
- Python快速教程 (手冊)Python
- Python資料分析入門知識手冊Python
- 快速排序快速入門排序
- VI的競爭對手Emacs 快速入門(轉)Mac
- Git – 版本控制工具十分鐘入門手冊Git
- Fvwm新手入門不完全手冊(原創) (轉)
- 自學前端如何快速入門?怎麼快速入門前端?前端
- SQL快速入門 ( MySQL快速入門, MySQL參考, MySQL快速回顧 )MySql
- MySQL 快速入門MySql
- mysqlsla快速入門MySql
- Pipenv 快速入門