zookeeper使用教程

十四lin發表於2021-06-29

Zookeeper

1.       Zookeeper概述

1.1 概述

Zookeeper是一個開源的分散式的,為分散式應用提供協調服務的Apache專案。

1.2 特點

 

1)Zookeeper:一個領導者(leader),多個跟隨者(follower)組成的叢集。

2)Leader負責進行投票的發起和決議,更新系統狀態。

3)Follower用於接收客戶請求並向客戶端返回結果,在選舉Leader過程中參與投票。

4)叢集中只要有半數以上節點存活,Zookeeper叢集就能正常服務。

5)全域性資料一致:每個server儲存一份相同的資料副本,client無論連線到哪個server,資料都是一致的。

6)更新請求順序進行,來自同一個client的更新請求按其傳送順序依次執行。

7)資料更新原子性,一次資料更新要麼成功,要麼失敗。

8)實時性,在一定時間範圍內,client能讀到最新資料。

1.3 資料結構

ZooKeeper資料模型的結構與Unix檔案系統很類似,整體上可以看作是一棵樹,每個節點稱做一個ZNode。每一個ZNode預設能夠儲存1MB的資料,每個ZNode都可以通過其路徑唯一標識。

 

資料結構圖

1.4 應用場景

提供的服務包括:統一命名服務、統一配置管理、統一叢集管理、伺服器節點動態上下線、軟負載均衡等。

1.4.1 統一命名服務

在分散式環境下,經常需要對應用/服務進行統一命名,便於識別不同服務。

(1)類似於域名與ip之間對應關係,ip不容易記住,而域名容易記住。

(2)通過名稱來獲取資源或服務的地址,提供者等資訊。

1.4.2 統一配置管理

1)分散式環境下,配置檔案管理和同步是一個常見問題。

(1)一個叢集中,所有節點的配置資訊是一致的,比如 Hadoop 叢集。

(2)對配置檔案修改後,希望能夠快速同步到各個節點上。

2)配置管理可交由ZooKeeper實現。

(1)可將配置資訊寫入ZooKeeper上的一個Znode。

(2)各個節點監聽這個Znode。

(3)一旦Znode中的資料被修改,ZooKeeper將通知各個節點。

1.4.3 統一叢集管理

1)分散式環境中,實時掌握每個節點的狀態是必要的。

(1)可根據節點實時狀態做出一些調整。

2)可交由ZooKeeper實現。

(1)可將節點資訊寫入ZooKeeper上的一個Znode。

(2)監聽這個Znode可獲取它的實時狀態變化。

3)典型應用

(1)HBase中Master狀態監控與選舉。

1.4.4 伺服器節點動態上下線

客戶端能實時洞察到伺服器上下線的變化.

1.4.5 軟負載均衡

負載均衡,英文名稱為Load Balance,其含義就是指將負載(工作任務)進行平衡、分攤到多個操作單元上進行執行,例如FTP伺服器、Web伺服器、企業核心應用伺服器和其它主要任務伺服器等,從而協同完成工作任務。

1.5 下載地址

1)官網首頁:

https://zookeeper.apache.org/

2.       Zookeeper安裝

2.1.    叢集規劃

在hadoop01、hadoop02和hadoop03三個節點上部署Zookeeper。

2.2.    解壓安裝

(1)解壓zookeeper安裝包到/opt/module/目錄下

[root@hadoop102 software]$ tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/

(2)在/opt/module/zookeeper-3.4.10/這個目錄下建立data

       mkdir -p data

(3)重新命名/opt/module/zookeeper-3.4.10/conf這個目錄下的zoo_sample.cfg為zoo.cfg

       mv zoo_sample.cfg zoo.cfg

2.3.    配置zoo.cfg檔案

       (1)具體配置

       dataDir=/opt/module/zookeeper-3.4.10/data

       增加如下配置

       #######################cluster##########################

server.1=hadoop01:2888:3888

server.2=hadoop02:2888:3888

server.3=hadoop03:2888:3888

(2)配置引數解讀

Server.A=B:C:D。

A是一個數字,表示這個是第幾號伺服器;

B是這個伺服器的ip地址;

C是這個伺服器與叢集中的Leader伺服器交換資訊的埠;

D是萬一叢集中的Leader伺服器掛了,需要一個埠來重新進行選舉,選出一個新的Leader,而這個埠就是用來執行選舉時伺服器相互通訊的埠。

叢集模式下配置一個檔案myid,這個檔案在dataDir目錄下,這個檔案裡面有一個資料就是A的值,Zookeeper啟動時讀取此檔案,拿到裡面的資料與zoo.cfg裡面的配置資訊比較從而判斷到底是哪個server。

2.4.    叢集操作

(1)在/opt/module/zookeeper-3.4.10/data目錄下建立一個myid的檔案

       touch myid

新增myid檔案,注意一定要在linux裡面建立,在notepad++裡面很可能亂碼

(2)編輯myid檔案

       vi myid

       在檔案中新增與server對應的編號:如1

(3)分發拷貝配置好的zookeeper到其他機器上

(4)分別啟動zookeeper

       [root@hadoop01 zookeeper-3.4.10]# bin/zkServer.sh start

[root@hadoop02 zookeeper-3.4.10]# bin/zkServer.sh start

[root@hadoop03 zookeeper-3.4.10]# bin/zkServer.sh start

(5)檢視狀態

[root@hadoop01 zookeeper-3.4.10]# bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg

Mode: follower

[root@hadoop02 zookeeper-3.4.10]# bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg

Mode: leader

[root@hadoop03 zookeeper-3.4.5]# bin/zkServer.sh status

JMX enabled by default

Using config: /opt/module/zookeeper-3.4.10/bin/../conf/zoo.cfg

Mode: follower

2.5.    附zoo.cfg檔案中引數含義

1)tickTime=2000:通訊心跳數,Zookeeper伺服器心跳時間,單位毫秒

Zookeeper使用的基本時間,伺服器之間或客戶端與伺服器之間維持心跳的時間間隔,也就是每個tickTime時間就會傳送一個心跳,時間單位為毫秒。

它用於心跳機制,並且設定最小的session超時時間為兩倍心跳時間。(session的最小超時時間是2*tickTime)

2)initLimit=10:Leader和Follower初始通訊時限

叢集中的follower跟隨者伺服器與leader領導者伺服器之間初始連線時能容忍的最多心跳數(tickTime的數量),用它來限定叢集中的Zookeeper伺服器連線到Leader的時限。

投票選舉新leader的初始化時間

Follower在啟動過程中,會從Leader同步所有最新資料,然後確定自己能夠對外服務的起始狀態。

Leader允許Follower在initLimit時間內完成這個工作。

3)syncLimit=5:Leader和Follower同步通訊時限

叢集中Leader與Follower之間的最大響應時間單位,假如響應超過syncLimit * tickTime,Leader認為Follwer死掉,從伺服器列表中刪除Follwer。

在執行過程中,Leader負責與ZK叢集中所有機器進行通訊,例如通過一些心跳檢測機制,來檢測機器的存活狀態。

如果L發出心跳包在syncLimit之後,還沒有從F那收到響應,那麼就認為這個F已經不線上了。

4)dataDir:資料檔案目錄+資料持久化路徑

儲存記憶體資料庫快照資訊的位置,如果沒有其他說明,更新的事務日誌也儲存到資料庫。

5)clientPort=2181:客戶端連線埠

監聽客戶端連線的埠

3.       Zookeeper shell客戶端操作

命令基本語法

功能描述

help

顯示所有操作命令

ls path [watch]

使用 ls 命令來檢視當前znode中所包含的內容

ls2 path [watch]

檢視當前節點資料並能看到更新次數等資料

create

普通建立

-s  含有序列

-e  臨時(重啟或者超時消失)

get path [watch]

獲得節點的值

set

設定節點的具體值

stat

檢視節點狀態

delete

刪除節點

rmr

遞迴刪除節點

1)啟動客戶端

[root@hadoop103 zookeeper-3.4.10]$ bin/zkCli.sh

2)顯示所有操作命令

[zk: localhost:2181(CONNECTED) 1] help

3)檢視當前znode中所包含的內容

[zk: localhost:2181(CONNECTED) 0] ls /

[zookeeper]

4)檢視當前節點資料並能看到更新次數等資料

[zk: localhost:2181(CONNECTED) 1] ls2 /

[zookeeper]

cZxid = 0x0

ctime = Thu Jan 01 08:00:00 CST 1970

mZxid = 0x0

mtime = Thu Jan 01 08:00:00 CST 1970

pZxid = 0x0

cversion = -1

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 0

numChildren = 1

5)建立普通節點

[zk: localhost:2181(CONNECTED) 2] create /app1 "hello app1"

Created /app1

[zk: localhost:2181(CONNECTED) 4] create /app1/server101 "192.168.1.101"

Created /app1/server101

6)獲得節點的值

[zk: localhost:2181(CONNECTED) 6] get /app1

hello app1

cZxid = 0x20000000a

ctime = Mon Jul 17 16:08:35 CST 2017

mZxid = 0x20000000a

mtime = Mon Jul 17 16:08:35 CST 2017

pZxid = 0x20000000b

cversion = 1

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 10

numChildren = 1

[zk: localhost:2181(CONNECTED) 8] get /app1/server101

192.168.1.101

cZxid = 0x20000000b

ctime = Mon Jul 17 16:11:04 CST 2017

mZxid = 0x20000000b

mtime = Mon Jul 17 16:11:04 CST 2017

pZxid = 0x20000000b

cversion = 0

dataVersion = 0

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 13

numChildren = 0

7)建立短暫節點

[zk: localhost:2181(CONNECTED) 9] create -e /app 8888

(1)在當前客戶端是能檢視到的

[zk: localhost:2181(CONNECTED) 10] ls /

[app1, app, zookeeper]

(2)退出當前客戶端然後再重啟客戶端

       [zk: localhost:2181(CONNECTED) 12] quit

[root@hadoop104 zookeeper-3.4.10]$ bin/zkCli.sh

(3)再次檢視根目錄下短暫節點已經刪除

       [zk: localhost:2181(CONNECTED) 0] ls /

[app1, zookeeper]

8)建立帶序號的節點

       (1)先建立一個普通的根節點app2

       [zk: localhost:2181(CONNECTED) 11] create /app2 "app2"

       (2)建立帶序號的節點

       [zk: localhost:2181(CONNECTED) 13] create -s /app2/aa 888

Created /app2/aa0000000000

[zk: localhost:2181(CONNECTED) 14] create -s /app2/bb 888

Created /app2/bb0000000001

[zk: localhost:2181(CONNECTED) 15] create -s /app2/cc 888

Created /app2/cc0000000002

如果原節點下有1個節點,則再排序時從1開始,以此類推。

[zk: localhost:2181(CONNECTED) 16] create -s /app1/aa 888

Created /app1/aa0000000001

9)修改節點資料值

[zk: localhost:2181(CONNECTED) 2] set /app1 999

10)節點的值變化監聽

       (1)在104主機上註冊監聽/app1節點資料變化

[zk: localhost:2181(CONNECTED) 26] get /app1 watch

       (2)在103主機上修改/app1節點的資料

[zk: localhost:2181(CONNECTED) 5] set /app1  777

       (3)觀察104主機收到資料變化的監聽

WATCHER::

WatchedEvent state:SyncConnected type:NodeDataChanged path:/app1

11)節點的子節點變化監聽(路徑變化)

       (1)在02主機上註冊監聽/app1節點的子節點變化

[zk: localhost:2181(CONNECTED) 1] ls /app1 watch

[aa0000000001, server101]

       (2)在03主機/app1節點上建立子節點

[zk: localhost:2181(CONNECTED) 6] create /app1/bb 666

Created /app1/bb

       (3)觀察02主機收到子節點變化的監聽

WATCHER::

WatchedEvent state:SyncConnected type:NodeChildrenChanged path:/app1

12)刪除節點

[zk: localhost:2181(CONNECTED) 4] delete /app1/bb

13)遞迴刪除節點

[zk: localhost:2181(CONNECTED) 7] rmr /app2

14)檢視節點狀態

[zk: localhost:2181(CONNECTED) 12] stat /app1

cZxid = 0x20000000a

ctime = Mon Jul 17 16:08:35 CST 2017

mZxid = 0x200000018

mtime = Mon Jul 17 16:54:38 CST 2017

pZxid = 0x20000001c

cversion = 4

dataVersion = 2

aclVersion = 0

ephemeralOwner = 0x0

dataLength = 3

numChildren = 2

4.       Java API應用

4.1.    建立ZooKeeper客戶端

private static String connectString = "hadoop01:2181,hadoop02:2181,hadoop03:2181";

    private static int sessionTimeout = 2000;

    private ZooKeeper zkClient = null;

 

    @Before

    public void init() throws Exception {

 

    zkClient = new ZooKeeper(connectString, sessionTimeout, new Watcher() {

            @Override

            public void process(WatchedEvent event) {

                // 收到事件通知後的回撥函式(使用者的業務邏輯)

                System.out.println(event.getType() + "--" + event.getPath());

 

                // 再次啟動監聽

                try {

                    zkClient.getChildren("/", true);

                } catch (Exception e) {

                    e.printStackTrace();

                }

            }

        });

    }

4.2.    建立子節點

    // 建立子節點

    @Test

    public void create() throws Exception {

        // 資料的增刪改查

        // 引數1:要建立的節點的路徑; 引數2:節點資料 ; 引數3:節點許可權 ;引數4:節點的型別

        String nodeCreated = zkClient.create("/eclipse", "hello zk".getBytes(), Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);

    }

4.3.    獲取子節點並監聽

// 獲取子節點

    @Test

    public void getChildren() throws Exception {

        List<String> children = zkClient.getChildren("/", true);

 

        for (String child : children) {

            System.out.println(child);

        }

 

        // 延時阻塞

        Thread.sleep(Long.MAX_VALUE);

    }

4.4.    判斷znode是否存在

// 判斷znode是否存在

    @Test

    public void exist() throws Exception {

        Stat stat = zkClient.exists("/eclipse", false);

 

        System.out.println(stat == null ? "not exist" : "exist");

    }

5.       案例實戰

5.1.    監聽伺服器節點動態上下線案例

1)         需求:某分散式系統中,主節點可以有多臺,可以動態上下線,任意一臺客戶端都能實時感知到主節點伺服器的上下線

5.2.    需求分析

5.3.    程式碼實現

(1)現在叢集上建立/servers節點

[zk: localhost:2181(CONNECTED) 10] create /servers "servers"

Created /servers

(2)建立工程並匯入依賴

<dependency>

    <groupId>junit</groupId>

    <artifactId>junit</artifactId>

    <scope>test</scope>

</dependency>

<dependency>

    <groupId>org.apache.zookeeper</groupId>

    <artifactId>zookeeper</artifactId>

    <version>3.4.10</version>

</dependency>

 

(3)伺服器端程式碼

import java.io.IOException;

import org.apache.zookeeper.CreateMode;

import org.apache.zookeeper.WatchedEvent;

import org.apache.zookeeper.Watcher;

import org.apache.zookeeper.ZooKeeper;

import org.apache.zookeeper.ZooDefs.Ids;

 

public class DistributeServer {

 

    private static String connectString = "hadoop01:2181,hadoop02:2181,hadoop03:2181";

    private static int sessionTimeout = 2000;

    private ZooKeeper zk = null;

    private String parentNode = "/servers";

   

    // 建立到zk的客戶端連線

    public void getConnect() throws IOException{

       

        zk = new ZooKeeper(connectString, sessionTimeout, new Watcher() {

 

            @Override

            public void process(WatchedEvent event) {

 

            }

        });

    }

   

    // 註冊伺服器

    public void registServer(String hostname) throws Exception{

        String create = zk.create(parentNode + "/server", hostname.getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);

       

        System.out.println(hostname +" is noline "+ create);

    }

   

    // 業務功能

    public void business(String hostname) throws Exception{

        System.out.println(hostname+" is working ...");

       

        Thread.sleep(Long.MAX_VALUE);

    }

   

    public static void main(String[] args) throws Exception {

        // 獲取zk連線

        DistributeServer server = new DistributeServer();

        server.getConnect();

       

        // 利用zk連線註冊伺服器資訊

        server.registServer(args[0]);

       

        // 啟動業務功能

        server.business(args[0]);

    }

}

(4)客戶端程式碼

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import org.apache.zookeeper.WatchedEvent;

import org.apache.zookeeper.Watcher;

import org.apache.zookeeper.ZooKeeper;

 

public class DistributeClient {

    private static String connectString = "hadoop01:2181,hadoop02:2181,hadoop03:2181";

    private static int sessionTimeout = 2000;

    private ZooKeeper zk = null;

    private String parentNode = "/servers";

    private volatile ArrayList<String> serversList = new ArrayList<>();

 

    // 建立到zk的客戶端連線

    public void getConnect() throws IOException {

        zk = new ZooKeeper(connectString, sessionTimeout, new Watcher() {

 

            @Override

            public void process(WatchedEvent event) {

 

                // 再次啟動監聽

                try {

                    getServerList();

                } catch (Exception e) {

                    e.printStackTrace();

                }

            }

        });

    }

 

    //

    public void getServerList() throws Exception {

       

        // 獲取伺服器子節點資訊,並且對父節點進行監聽

        List<String> children = zk.getChildren(parentNode, true);

        ArrayList<String> servers = new ArrayList<>();

       

        for (String child : children) {

            byte[] data = zk.getData(parentNode + "/" + child, false, null);

 

            servers.add(new String(data));

        }

 

        // 把servers賦值給成員serverList,已提供給各業務執行緒使用

        serversList = servers;

 

        System.out.println(serversList);

    }

 

    // 業務功能

    public void business() throws Exception {

        System.out.println("client is working ...");

Thread.sleep(Long.MAX_VALUE);

    }

 

    public static void main(String[] args) throws Exception {

 

        // 獲取zk連線

        DistributeClient client = new DistributeClient();

        client.getConnect();

 

        // 獲取servers的子節點資訊,從中獲取伺服器資訊列表

        client.getServerList();

 

        // 業務程式啟動

        client.business();

    }

}

 

 

僅供參考,有錯誤還請指出!

有什麼想法,評論區留言,互相指教指教。

覺得不錯的可以點一下右邊的推薦喲

 

相關文章