hadoop-叢集管理(3)——不常用引數
1. hadoop日誌目錄
預設存放在hadoop安裝目錄下的logs資料夾中,也可以透過hadoop-env.sh中的HADOOP_LOG_DIR變數來修改。一般建議修改預設值,使之獨立於hadoop安裝目錄,這樣便於以後的升級。
hadoop日誌檔案的名稱格式為“hadoop-使用者名稱-守護程式名-本地主機名.log”。例如“hadoop-tianyc-namenode-Route.log”就是我的hadoop叢集中的一個日誌檔案。其中“使用者名稱”部分對應hadoop-env.sh檔案中的HADOOP_IDENT_STRING變數,可以透過修改該變數來修改日誌檔案中的使用者名稱資訊。
2. SSH設定
hadoop-env.sh檔案中的HADOOP_SSH_OPTS變數可以向SSH傳遞很多選項,進行SSH的自定義。例如:
- 使用ConnectTimeout選項來設定減小連線超時,可以避免控制指令碼長時間等待當機節點的響應(當然,也不能設定得太低,使得繁忙節點被跳過)。
- 使用StrickHostKeyChecking選項設定為no,則會將新主機鍵加入已知主機檔案中。該值預設為ask,不適合大型叢集環境。
3. 使用rsync
透過rsync工具,hadoop控制指令碼能夠將配置檔案分發到叢集的各個節點中。預設該功能未啟用,可以透過設定hadoop-env.sh中的HADOOP_MASTER變數啟動。啟用rsync後,當工作節點的守護程式啟動後,會把以HADOOP_MASTER為根的目錄樹與本地的HADOOP_INSTALL目錄同步。
4. 與rsync相關的變數
在大型叢集中,若rsync已啟用,則叢集啟動時所有工作節點幾乎同時啟動,且同時向主節點發出rsync請求,可能導致主節點癱瘓。這就需要設定hadoop-env.sh中的另一個變數:HADOOP_SLAVE_SLEEP,將它設定為一小段時間(例如0.1秒)。該變數度量為“秒”。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/26613085/viewspace-1253879/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- hadoop-叢集管理(1)——配置檔案Hadoop
- hadoop-叢集管理(4)——關鍵屬性Hadoop
- Hadoop-叢集執行Hadoop
- hadoop-叢集管理(2)——記憶體設定Hadoop記憶體
- MySQL Galera cluster叢集常用引數說明MySql
- 十 叢集管理常用命令
- 大資料叢集核心引數調優大資料
- 叢集管理工具C3
- RAC常用管理命令--叢集、例項、資源管理-更新中
- kubernetes叢集管理常用命令一
- MongoDB分片叢集常用操作MongoDB
- hadoop叢集搭建配置檔案優化引數Hadoop優化
- tkinter模組常用引數(python3)Python
- KunlunDB叢集管理介面
- saltstack搭建叢集3
- Oracle 叢集心跳及其引數misscount/disktimeout/reboottimeOracleboot
- Kafka_2.12-2.5.1叢集搭建與引數調優Kafka
- docker下的spark叢集,調整引數榨乾硬體DockerSpark
- hbase叢集 常用維護命令
- redis叢集之分片叢集的原理和常用代理環境部署Redis
- Git常用引數Git
- 常用JVM引數JVM
- 使用Chef管理windows叢集Windows
- xCAT叢集管理配置工具
- 線上ES叢集引數配置引起的業務異常案例分析
- 【RAC】Oracle叢集心跳及其引數misscount/disktimeout/reboottimeOracleboot
- 管理 ES 叢集:叢集與外部間的安全通訊
- 管理 ES 叢集:叢集內部間的安全通訊
- Hadoop叢集常用命令Hadoop
- linux叢集常用命令Linux
- Es叢集搭建,及常用外掛
- Java虛擬機器3:常用JVM命令引數Java虛擬機JVM
- 叢集管理工具ansible常用命令介紹(一)
- RAC常用管理命令--查詢RAC叢集各種資訊命令-更新中
- Oracle叢集軟體管理-新增和刪除叢集節點Oracle
- 管理 ES 叢集:分片設定及管理
- Redis Manager 叢集管理與節點管理Redis
- Elasticsearch——叢集管理及文件CRUDElasticsearch