生產調優4 HDFS-叢集擴容及縮容(含伺服器間資料均衡)

rananie發表於2021-12-07

原文網址 : https://www.cnblogs.com/rananie/p/15658569.html

伺服器

HDFS-叢集擴容及縮容

HDFS-叢集擴容及縮容

新增白名單

白名單：在白名單的主機IP地址可以訪問叢集，對叢集進行資料的儲存。不在白名單的主機可以訪問叢集，但是不會在主機上儲存資料
企業中：配置白名單，可以儘量防止黑客惡意訪問攻擊。

配置白名單的步驟

1.在NameNode節點的主機(hadoop102)/opt/module/hadoop-3.1.3/etc/hadoop目錄下分別建立whitelist和blacklist檔案

建立白名單

[ranan@hadoop102 hadoop]$ vim whitelist
hadoop102
hadoop103
[ranan@hadoop102 hadoop]$ touch blacklist # 為後續黑名單做準備

2.在 /opt/module/hadoop-3.1.3/etc/hadoop下的hdfs-site.xml 配置檔案中增加 dfs.hosts 配置引數

與當前叢集建立聯絡

[ranan@hadoop102 hadoop]$ vim hdfs-site.xml 
# 新增
<!-- 白名單 -->
<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>
<!-- 黑名單 -->
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>

# 分發給其他節點
[ranan@hadoop102 hadoop]$ xsync whitelist blacklist  hdfs-site.xml

3.第一次新增白名單(黑名單)必須重啟叢集，不是第一次，只需要重新整理 NameNode 節點。

[ranan@hadoop102 hadoop-3.1.3]$ myhadoop.sh stop
[ranan@hadoop102 hadoop-3.1.3]$ myhadoop.sh start

4.在 web 瀏覽器上檢視 DataNode

沒有104了,但是104還是啟動了相應的程式

[ranan@hadoop102 bin]$ jpsall
=============== hadoop102 ===============
2918 DataNode
2760 NameNode
3721 Jps
3515 JobHistoryServer
3310 NodeManager
=============== hadoop103 ===============
2947 NodeManager
2789 ResourceManager
3367 Jps
2558 DataNode
=============== hadoop104 ===============
3059 Jps
2825 NodeManager
2538 DataNode
2670 SecondaryNameNode

5.在 hadoop104 上執行上傳資料

[ranan@hadoop104 bin]$ hadoop fs -put myhadoop.sh /

客戶端還可以訪問叢集

但是資料不會在hadoop104上儲存

二次配置白名單

1.增加hadoop104

[ranan@hadoop104 bin]$ cd /opt/module/hadoop-3.1.3/etc/hadoop/
[ranan@hadoop104 hadoop]$ vim whitelist 
[ranan@hadoop104 hadoop]$ cat whitelist 
hadoop102
hadoop103
hadoop104
[ranan@hadoop104 hadoop]$ xsync whitelist

2.重新整理NameNode

[ranan@hadoop104 hadoop]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

34.在 web 瀏覽器上檢視 DataNode

3.刪除之前上傳的，重新進行提交

[ranan@hadoop104 bin]$ hadoop fs -put myhadoop.sh /

增加新伺服器

需求

隨著公司業務的增長，資料量越來越大，原有的資料節點的容量已經不能滿足儲存資料
的需求，需要在原有叢集基礎上動態新增新的資料節點。

動態新增：不重啟已有叢集

環境準備

在hadoop100主機上再克隆一臺hadoop105主機

修改IP地址和主機名稱

[ranan@hadoop100 ~]$ sudo vim /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR=192.168.10.105 #修改成105
[ranan@hadoop100 ~]$ sudo vim /etc/hostname
hadoop105
[ranan@hadoop100 ~]$reboot

之前已經配置過了主機名及地址對映，所以就不用在所有節點/etc/host的檔案中新增新節點。這裡直接使用hadoop105進行連線

將hadoop102裡module下的hadoop和jdk傳給hadoop105，拷貝環境變數給hadoop105

[ranan@hadoop102 opt]$ scp -r module/* ranan@hadoop105:/opt/module/
[ranan@hadoop102 etc]$ sudo scp /etc/profile.d/my_env.sh root@hadoop105:/etc/profile.d/
# 在105上使環境變數生效
[ranan@hadoop105 module]$ source /etc/profile

配置無密連線，hadoop102(NameNode)、hadoop103（ResourceManager）到hadoop105

# 102 - 105
[ranan@hadoop102 etc]$ cd ~/.ssh
[ranan@hadoop102 .ssh]$ ssh-copy-id hadoop105
# 103 - 105
[ranan@hadoop103 ~]$ cd .ssh
[ranan@hadoop103 .ssh]$ ssh-copy-id hadoop105

此時hadoop102上的data和log也在hadoop105上，但是hadoop105是不能用的
在hadoop105上刪除hadoop102的data和logs

[ranan@hadoop105 hadoop-3.1.3]$ rm -rf data/ logs/

服役新節點具體步驟

直接啟動 DataNode，即可關聯到叢集

[ranan@hadoop105 hadoop-3.1.3]$ hdfs --daemon start datanode
WARNING: /opt/module/hadoop-3.1.3/logs does not exist. Creating.
[ranan@hadoop105 hadoop-3.1.3]$ jps
2640 DataNode
2724 Jps
[ranan@hadoop105 hadoop-3.1.3]$ yarn --daemon start nodemanager
[ranan@hadoop105 hadoop-3.1.3]$ jps
2640 DataNode
2784 NodeManager
2887 Jps

檢視

因為我們配置了白名單，所以沒有立即生效，那把hadoop105新增進去。
在hadoop102上的/opt/module/hadoop-3.1.3/etc/hadoop目錄下whiltelist
注意這裡分發的指令碼里面只有102、103、104所以這裡還需要手動的在Hadoop105上修改

[ranan@hadoop102 hadoop]$ vim whitelist 
hadoop102
hadoop103
hadoop104
hadoop105
[ranan@hadoop102 hadoop]$ xsync whitelist

不是第一次配置白名單，不用停止叢集，直接重新整理NameNode

[ranan@hadoop102 hadoop]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

新增成功

在hadoop105上測試是否能上傳成功

[ranan@hadoop105 hadoop-3.1.3]$ hadoop fs -put wuguo.txt /

問題1 伺服器間資料均衡

那麼就存在一個問題，哪個節點上傳的資料最多，那麼他儲存的資料就多，會導致儲存不均衡的情況
如果資料不均衡（hadoop105 資料少，其他節點資料多），怎麼處理？
解決辦法：服務間資料均衡

問題2 105是怎麼關聯到叢集的

在核心配置檔案core-site.xml 裡指定NameNode在哪個伺服器上（hadoop102上）,作為DataNode自動取報告了

DataNode啟動後告訴NameNode本機的塊資訊(塊是否完好)

伺服器間資料均衡

應用場景

場景1：如果經常在 hadoop102 和 hadoop104 上提交任務，且副本數為 2，由於資料本地性原則，就會導致 hadoop102 和 hadoop104 資料過多， hadoop103 儲存的資料量小。

場景2：新服役的伺服器資料量比較少，需要執行叢集均衡命令

伺服器間資料均衡配置

開啟資料均衡命

[ranan@hadoop102 hadoop-3.1.3]$ cd /opt/module/hadoop-3.1.3
[ranan@hadoop102 hadoop-3.1.3]$ sbin/start-balancer.sh -threshold 10

對於引數 10，代表的是叢集中各個節點(任意兩個節點)的磁碟空間利用率相差不超過 10%，可根據實際情況進行調整

我這裡虛擬機器資料量不大，所以執行了該命令沒反應

停止資料均衡命令

如果開啟命令執行時間過長，我們也可以停止

[ranan@hadoop102 hadoop-3.1.3]$ sbin/stop-balancer.sh

由於 HDFS 需要啟動單獨的 Rebalance Server 來執行 Rebalance 操作，所以儘量
不要在 NameNode 上執行 start-balancer.sh，而是找一臺比較空閒的機器

黑名單退役舊節點

黑名單：在黑名單的主機 IP 地址不可以訪問叢集(待測試!)，不能用來儲存資料。
企業中：配置黑名單，用來退役伺服器。

黑名單配置步驟

編輯/opt/module/hadoop-3.1.3/etc/hadoop 目錄下的 blacklist 檔案
需要在 hdfs-site.xml 配置檔案中增加 dfs.hosts 配置引數

配置白名單時新建了，並在hdfs-site檔案中增加了dfs.hosts.exclude配置引數，這裡我們就不修改了

<!-- 黑名單 -->
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>

之前已經重啟叢集了，這裡我們就相當於不是首次配置了，直接重新整理NameNode節點就行

[ranan@hadoop102 hp]$ cd /opt/module/hadoop-3.1.3/etc/hadoop/
[ranan@hadoop102 hadoop]$ vim blacklist 
hadoop105
[ranan@hadoop102 hadoop]$ xsync blacklist # 分發，105節點手動新增(也可以不配置因為它被拉入了黑名單)
[ranan@hadoop102 hadoop]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

網頁檢視

如果立即檢視，hadoop105處於Decommissioning(退役中)狀態，把hadoop105的副本複製給其他節點。
如下圖，把副本給了hadoop103

等待退役節點狀態為 decommissioned（所有塊已經複製完成），停止該節點及節點資源
管理器。注意：如果副本數是 3，當前服役的節點小於等於 3，是不能退役成功的，需要修改
副本數後才能退役

終止程式
stop hadoop105 datanode/nodemanager

[ranan@hadoop105 hadoop]$ hdfs --daemon stop datanode
[ranan@hadoop105 hadoop]$ yarn --daemon stop nodemanager

退役時可能其他伺服器資料猛增所以一般都需要叢集資料在平衡

[ranan@hadoop102 hadoop]$sbin/start-balancer.sh -threshold 10

Redis—叢集擴縮容
2024-04-06
Redis
hdfs叢集的擴容和縮容
2023-04-04
Redis Cluster 叢集搭建與擴容、縮容
2022-03-27
Redis
Openshif對叢集的擴容與縮容
2021-09-09
Airbnb的動態 Kubernetes 叢集擴縮容
2022-08-25
AI
ceph叢集的OSD管理基礎及OSD節點擴縮容
2024-08-21
Redis大叢集擴容效能優化實踐
2021-10-18
Redis優化
達夢資料庫DSC架構下ASM擴容及表空間擴容實施
2022-07-07
資料庫架構ASM
四 GBase 8a MPP Cluster叢集縮容
2020-05-21
三 GBase 8a MPP Cluster叢集擴容
2020-05-21
mysql共享表空間擴容,收縮,遷移
2018-03-30
MySql
資料盤擴容
2024-07-04
MogDB openGauss資料庫擴縮容的幾種方式
2024-03-14
資料庫
Redis大叢集擴容效能最佳化實踐
2021-10-18
Redis
大資料叢集核心引數調優
2024-09-09
大資料
Dubbo學習筆記(四)叢集容錯與負載均衡
2018-04-13
筆記負載
在 kubernetes 環境下如何優雅擴縮容 Pulsar
2024-03-29
Dubbo剖析-叢集容錯
2018-05-24
Dubbo示例——叢集容錯
2019-04-21
ClickHouse叢集資料均衡方案分享
2021-12-11
Fluid 0.5 版本釋出：開啟資料集快取線上彈性擴縮容之路
2021-03-22
UI快取
跟我一起學Knative(4)--Serving 自動擴縮容
2020-05-17
redis主從叢集搭建及容災部署(哨兵sentinel)
2020-12-01
Redis
V8R6叢集節點擴容步驟整理
2023-12-13
Mysql學習筆記---MySQL叢集架構之擴容方案
2020-12-20
MySql筆記架構
Java程式設計解密-Dubbo負載均衡與叢集容錯機制
2018-08-11
Java程式設計解密負載
redis工具擴容收縮運維工具
2024-08-25
Redis運維
資料庫平滑擴容方案剖析
2022-11-23
資料庫
Ubuntu 22.04擴容LVM空間
2024-06-12
UbuntuLVM
Ubuntu空間不足，如何擴容
2022-10-08
Ubuntu
預算有限，資源冗餘？DWS叢集縮容如何幫你解決煩勞
2024-02-29
OceanBase 資料檔案縮容實踐
2023-09-27
ext4和xfs檔案系統的擴容和收縮
2020-12-26
kubernetes實踐之四十一：Pod自動擴容與縮容
2018-05-14
Elasticsearch叢集搭建教程及生產環境配置
2021-09-01
Elasticsearch
orleans叢集及負載均衡實現
2022-01-15
負載
KVM 虛機映象操作, 擴容和壓縮
2022-02-28
如何根據不同業務場景調節 HPA 擴縮容靈敏度
2021-01-07