一篇有趣的負載均衡演算法實現

未讀程式碼發表於2020-06-01
文章已經收錄在 Github.com/niumoo/JavaNotes ,更有 Java 程式設計師所需要掌握的核心知識,歡迎Star和指教。
歡迎關注我的公眾號,文章每週更新。

負載平衡(Load balancing)是一種在多個計算機(網路、CPU、磁碟)之間均勻分配資源,以提高資源利用的技術。使用負載均衡可以最大化服務吞吐量,可能最小化響應時間,同時由於使用負載均衡時,會使用多個伺服器節點代單點服務,也提高了服務的可用性。

負載均衡的實現可以軟體可以硬體,硬體如大名鼎鼎的 F5 負載均衡裝置,軟體如 NGINX 中的負載均衡實現,又如 Springcloud Ribbon 元件中的負載均衡實現。

如果看到這裡你還不知道負載均衡是幹嘛的,那麼只能放一張圖了,畢竟沒圖說個啥。

正經的負載均衡示例

負載均衡要做到在多次請求下,每臺伺服器被請求的次數大致相同。但是實際生產中,可能每臺機器的效能不同,我們會希望效能好的機器承擔的請求更多一些,這也是正常需求。

如果這樣說下來你看不懂,那我就再舉個例子好了,一排可愛的小熊(伺服器)站好。

一排要被訪問的伺服器

這時有人(使用者)要過來打臉(請求訪問)。

使用者請求

那麼怎麼樣我們才能讓這每一個可愛的小熊被打的次數大致相同呢?

又或者熊 4 比較胖,抗擊打能力是別人的兩倍,我們怎麼提高熊 4 被打的次數也是別人的兩倍呢?

又或者每次出手的力度不同,有重有輕,恰巧熊 4 總是承受這種大力度啪啪打臉,熊 4 即將不省熊事,還要繼續打它嗎?

這些都是值的思考的問題。

說了那麼多,口乾舌燥,我雙手已經飢渴難耐了,迫不及待的想要擼起程式碼了。

1. 隨機訪問

上面說了,為了負載均衡,我們必須保證多次出手後,熊 1 到熊 4 被打次數均衡。比如使用隨機訪問法,根據數學上的概率論,隨機出手次數越多,每隻熊被打的次數就會越相近。程式碼實現也比較簡單,使用一個隨機數,隨機訪問一個就可以了。

/** 伺服器列表 */
private static List<String> serverList = new ArrayList<>();
static {
    serverList.add("192.168.1.2");
    serverList.add("192.168.1.3");
    serverList.add("192.168.1.4");
    serverList.add("192.168.1.5");
}

/**
 * 隨機路由演算法
 */
public static String random() {
    // 複製遍歷用的集合,防止操作中集合有變更
    List<String> tempList = new ArrayList<>(serverList.size());
    tempList.addAll(serverList);
    // 隨機數隨機訪問
    int randomInt = new Random().nextInt(tempList.size());
    return tempList.get(randomInt);
}

因為使用了非執行緒安全的集合,所以在訪問操作時操作的是集合的拷貝,下面幾種輪訓方式中也是這種思想。

寫一個模擬請求方法,請求10w次,記錄請求結果。

public static void main(String[] args) {
    HashMap<String, Integer> serverMap = new HashMap<>();
    for (int i = 0; i < 20000; i++) {
        String server = random();
        Integer count = serverMap.get(server);
        if (count == null) {
            count = 1;
        } else {
            count++;
        }
        // 記錄
        serverMap.put(server, count);
    }
    // 路由總體結果
    for (Map.Entry<String, Integer> entry : serverMap.entrySet()) {
        System.out.println("IP:" + entry.getKey() + ",次數:" + entry.getValue());
    }
}

執行得到請求結果。

IP:192.168.1.3,次數:24979
IP:192.168.1.2,次數:24896
IP:192.168.1.5,次數:25043
IP:192.168.1.4,次數:25082

每臺伺服器被訪問的次數都趨近於 2.5w,有點負載均衡的意思。但是隨機畢竟是隨機,是不能保證訪問次數絕對均勻的。

2. 輪訓訪問

輪訓訪問就簡單多了,拿上面的熊1到熊4來說,我們一個接一個的啪啪 - 打臉,熊1打完打熊2,熊2打完打熊3,熊4打完打熊1,最終也是實現了被打均衡。但是保證均勻總是要付出代價的,隨機訪問中需要隨機,輪訓訪問中需要什麼來保證輪訓呢?

/** 伺服器列表 */
private static List<String> serverList = new ArrayList<>();
static {
    serverList.add("192.168.1.2");
    serverList.add("192.168.1.3");
    serverList.add("192.168.1.4");
    serverList.add("192.168.1.5");
}
private static Integer index = 0;

/**
 * 隨機路由演算法
 */
public static String randomOneByOne() {
    // 複製遍歷用的集合,防止操作中集合有變更
    List<String> tempList = new ArrayList<>(serverList.size());
    tempList.addAll(serverList);
    String server = "";
    synchronized (index) {
        index++;
        if (index == tempList.size()) {
            index = 0;
        }
        server = tempList.get(index);;
    }
    return server;
}

由程式碼裡可以看出來,為了保證輪訓,必須記錄上次訪問的位置,為了讓在併發情況下不出現問題,還必須在使用位置記錄時進行加鎖,很明顯這種互斥鎖增加了效能開銷。

依舊使用上面的測試程式碼測試10w次請求負載情況。

IP:192.168.1.3,次數:25000
IP:192.168.1.2,次數:25000
IP:192.168.1.5,次數:25000
IP:192.168.1.4,次數:25000

3. 輪訓加權

上面演示了輪訓方式,還記的一開始提出的熊4比較胖抗擊打能力強,可以承受別人2倍的捱打次數嘛?上面兩種方式都沒有體現出來熊 4 的這個特點,熊 4 竊喜,不痛不癢。但是熊 1 到 熊 3 已經在崩潰的邊緣,不行,我們必須要讓胖著多打,能者多勞,提高整體效能。

/** 伺服器列表 */
private static HashMap<String, Integer> serverMap = new HashMap<>();
static {
    serverMap.put("192.168.1.2", 2);
    serverMap.put("192.168.1.3", 2);
    serverMap.put("192.168.1.4", 2);
    serverMap.put("192.168.1.5", 4);
}
private static Integer index = 0;

/**
 * 加權路由演算法
 */
public static String oneByOneWithWeight() {
    List<String> tempList = new ArrayList();
    HashMap<String, Integer> tempMap = new HashMap<>();
    tempMap.putAll(serverMap);
    for (String key : serverMap.keySet()) {
        for (int i = 0; i < serverMap.get(key); i++) {
            tempList.add(key);
        }
    }
    synchronized (index) {
        index++;
        if (index == tempList.size()) {
            index = 0;
        }
        return tempList.get(index);
    }
}

這次記錄下了每臺伺服器的整體效能,給出一個數值,數值越大,效能越好。可以承受的請求也就越多,可以看到伺服器 192.168.1.5 的效能為 4,是其他伺服器的兩倍,依舊 10 w 請求測試。

IP:192.168.1.3,次數:20000
IP:192.168.1.2,次數:20000
IP:192.168.1.5,次數:40000
IP:192.168.1.4,次數:20000

192.168.1.5 承擔了 2 倍的請求。

4. 隨機加權

隨機加權的方式和輪訓加權的方式大致相同,只是把使用互斥鎖輪訓的方式換成了隨機訪問,按照概率論來說,訪問量增多時,服務訪問也會達到負載均衡。

/** 伺服器列表 */
private static HashMap<String, Integer> serverMap = new HashMap<>();
static {
    serverMap.put("192.168.1.2", 2);
    serverMap.put("192.168.1.3", 2);
    serverMap.put("192.168.1.4", 2);
    serverMap.put("192.168.1.5", 4);
}
/**
 * 加權路由演算法
 */
public static String randomWithWeight() {
    List<String> tempList = new ArrayList();
    HashMap<String, Integer> tempMap = new HashMap<>();
    tempMap.putAll(serverMap);
    for (String key : serverMap.keySet()) {
        for (int i = 0; i < serverMap.get(key); i++) {
            tempList.add(key);
        }
    }
    int randomInt = new Random().nextInt(tempList.size());
    return tempList.get(randomInt);
}

依舊 10 w 請求測試,192.168.1.5 的權重是其他伺服器的近似兩倍,

IP:192.168.1.3,次數:19934
IP:192.168.1.2,次數:20033
IP:192.168.1.5,次數:39900
IP:192.168.1.4,次數:20133

5. IP-Hash

上面的幾種方式要麼使用隨機數,要麼使用輪訓,最終都達到了請求的負載均衡。但是也有一個很明顯的缺點,就是同一個使用者的多次請求很有可能不是同一個服務進行處理的,這時問題來了,如果你的服務依賴於 session ,那麼因為服務不同, session 也會丟失,不是我們想要的,所以出現了一種根據請求端的 ip 進行雜湊計算來決定請求到哪一臺伺服器的方式。這種方式可以保證同一個使用者的請求落在同一個服務上。

private static List<String> serverList = new ArrayList<>();
static {
    serverList.add("192.168.1.2");
    serverList.add("192.168.1.3");
    serverList.add("192.168.1.4");
    serverList.add("192.168.1.5");
}

/**
 * ip hash 路由演算法
 */
public static String ipHash(String ip) {
    // 複製遍歷用的集合,防止操作中集合有變更
    List<String> tempList = new ArrayList<>(serverList.size());
    tempList.addAll(serverList);
    // 雜湊計算請求的伺服器
    int index = ip.hashCode() % serverList.size();
    return tempList.get(Math.abs(index));
}

6. 總結

上面的四種方式看似不錯,那麼這樣操作下來真的體現了一開始說的負載均衡嗎?答案是不一定的。就像上面的最後一個提問。

又或者每次出手的力度不同,有重有輕,恰巧熊 4 總是承受這種大力度啪啪打臉,熊 4 即將不省熊事,還要繼續打它嗎?

伺服器也是這個道理,每次請求進行的操作對資源的消耗可能是不同的。比如說某些操作它對 CPU 的使用就是比較高,也很正常。所以負載均衡有時不能簡單的通過請求的負載來作為負載均衡的唯一依據。還可以結合服務的當前連線數量、最近響應時間等維度進行總體均衡,總而言之,就是為了達到資源使用的負載均衡。

最後的話

文章已經收錄在 Github.com/niumoo/JavaNotes ,歡迎Star和指教。更有一線大廠面試點,Java程式設計師需要掌握的核心知識等文章,也整理了很多我的文字,歡迎 Star 和完善,希望我們一起變得優秀。

文章有幫助可以點個「」或「分享」,都是支援,我都喜歡!
文章每週持續更新,要實時關注我更新的文章以及分享的乾貨,可以關注「 未讀程式碼 」公眾號或者我的部落格

相關文章