分散式唯一ID的幾種生成方案

大雄45發表於2023-02-19

原文網址 : http://blog.itpub.net/69955379/viewspace-2935412/

前言

在網際網路的業務系統中，涉及到各種各樣的ID，如在支付系統中就會有支付ID、退款ID等。那一般生成ID都有哪些解決方案呢？特別是在複雜的分散式系統業務場景中，我們應該採用哪種適合自己的解決方案是十分重要的。下面我們一一來列舉一下，不一定全部適合，這些解決方案僅供你參考，或許對你有用。

正文

分散式ID的特性

唯一性：確保生成的ID是全網唯一的。
有序遞增性：確保生成的ID是對於某個使用者或者業務是按一定的數字有序遞增的。
高可用性：確保任何時候都能正確的生成ID。
帶時間：ID裡面包含時間，一眼掃過去就知道哪天的交易。

分散式ID的生成方案

1. UUID

演算法的核心思想是結合機器的網路卡、當地時間、一個隨記數來生成UUID。

優點：本地生成，生成簡單，效能好，沒有高可用風險
缺點：長度過長，儲存冗餘，且無序不可讀，查詢效率低

2. 資料庫自增ID

使用資料庫的id自增策略，如 MySQL 的 auto_increment。並且可以使用兩臺資料庫分別設定不同步長，生成不重複ID的策略來實現高可用。

優點：資料庫生成的ID絕對有序，高可用實現方式簡單
缺點：需要獨立部署資料庫例項，成本高，有效能瓶頸

3. 批量生成ID

一次按需批量生成多個ID，每次生成都需要訪問資料庫，將資料庫修改為最大的ID值，並在記憶體中記錄當前值及最大值。

優點：避免了每次生成ID都要訪問資料庫並帶來壓力，提高效能
缺點：屬於本地生成策略，存在單點故障，服務重啟造成ID不連續

4. Redis生成ID

Redis的所有命令操作都是單執行緒的，本身提供像 incr 和 increby 這樣的自增原子命令，所以能保證生成的 ID 肯定是唯一有序的。

優點：不依賴於資料庫，靈活方便，且效能優於資料庫；數字ID天然排序，對分頁或者需要排序的結果很有幫助。
缺點：如果系統中沒有Redis，還需要引入新的元件，增加系統複雜度；需要編碼和配置的工作量比較大。

考慮到單節點的效能瓶頸，可以使用 Redis 叢集來獲取更高的吞吐量。假如一個叢集中有5臺 Redis。可以初始化每臺 Redis 的值分別是1, 2, 3, 4, 5，然後步長都是 5。各個 Redis 生成的 ID 為：

A：1, 6, 11, 16, 21
B：2, 7, 12, 17, 22
C：3, 8, 13, 18, 23
D：4, 9, 14, 19, 24
E：5, 10, 15, 20, 25
複製程式碼

隨便負載到哪個機確定好，未來很難做修改。步長和初始值一定需要事先確定。使用 Redis 叢集也可以方式單點故障的問題。

另外，比較適合使用 Redis 來生成每天從0開始的流水號。比如訂單號 = 日期 + 當日自增長號。可以每天在 Redis 中生成一個 Key ，使用 INCR 進行累加。

5. Twitter的snowflake演算法

Twitter 利用 zookeeper 實現了一個全域性ID生成的服務 Snowflake：github.com/twitter/sno…

如上圖的所示，Twitter 的 Snowflake 演算法由下面幾部分組成：

1位符號位：

由於 long 型別在 java 中帶符號的，最高位為符號位，正數為 0，負數為 1，且實際系統中所使用的ID一般都是正數，所以最高位為 0。

41位時間戳（毫秒級）：

需要注意的是此處的 41 位時間戳並非儲存當前時間的時間戳，而是儲存時間戳的差值（當前時間戳 - 起始時間戳），這裡的起始時間戳一般是ID生成器開始使用的時間戳，由程式來指定，所以41位毫秒時間戳最多可以使用 (1 << 41) / (1000x60x60x24x365) = 69年。

10位資料機器位：

包括5位資料標識位和5位機器標識位，這10位決定了分散式系統中最多可以部署 1 << 10 = 1024 s個節點。超過這個數量，生成的ID就有可能會衝突。

12位毫秒內的序列：

這 12 位計數支援每個節點每毫秒（同一臺機器，同一時刻）最多生成 1 << 12 = 4096個ID

加起來剛好64位，為一個Long型。

優點：高效能，低延遲，按時間有序，一般不會造成ID碰撞
缺點：需要獨立的開發和部署，依賴於機器的時鐘

簡單實現

public class IdWorker {
    /**
     * 起始時間戳 2017-04-01
     */
    private final long epoch = 1491004800000L;
    /**
     * 機器ID所佔的位數
     */
    private final long workerIdBits = 5L;
    /**
     * 資料標識ID所佔的位數
     */
    private final long dataCenterIdBits = 5L;
    /**
     * 支援的最大機器ID,結果是31
     */
    private final long maxWorkerId = ~(-1L << workerIdBits);
    /**
     * 支援的最大資料標識ID,結果是31
     */
    private final long maxDataCenterId = ~(-1 << dataCenterIdBits);
    /**
     * 毫秒內序列在id中所佔的位數
     */
    private final long sequenceBits = 12L;
    /**
     * 機器ID向左移12位
     */
    private final long workerIdShift = sequenceBits;
    /**
     * 資料標識ID向左移17(12+5)位
     */
    private final long dataCenterIdShift = sequenceBits + workerIdBits;
    /**
     * 時間戳向左移22(12+5+5)位
     */
    private final long timestampShift = sequenceBits + workerIdBits + dataCenterIdBits;
    /**
     * 生成序列的掩碼，這裡為4095 (0b111111111111=0xfff=4095)
     */
    private final long sequenceMask = ~(-1L << sequenceBits);
    /**
     * 資料標識ID（0～31）
     */
    private long dataCenterId;
    /**
     * 機器ID（0～31）
     */
    private long workerId;
    /**
     * 毫秒內序列（0～4095）
     */
    private long sequence;
    /**
     * 上次生成ID的時間戳
     */
    private long lastTimestamp = -1L;

    public IdWorker(long dataCenterId, long workerId) {
        if (dataCenterId > maxDataCenterId || dataCenterId < 0) {
            throw new IllegalArgumentException(String.format("dataCenterId can't be greater than %d or less than 0", maxDataCenterId));
        }
        if (workerId > maxWorkerId || workerId < 0) {
            throw new IllegalArgumentException(String.format("worker Id can't be greater than %d or less than 0", maxWorkerId));
        }
        this.dataCenterId = dataCenterId;
        this.workerId = workerId;
    }

    /**
     * 獲得下一個ID (該方法是執行緒安全的)
     * @return snowflakeId
     */
    public synchronized long nextId() {
        long timestamp = timeGen();
        //如果當前時間小於上一次ID生成的時間戳,說明系統時鐘回退過,這個時候應當丟擲異常
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }
        //如果是同一時間生成的，則進行毫秒內序列
        if (timestamp == lastTimestamp) {
            sequence = (sequence + 1) & sequenceMask;
            //毫秒內序列溢位
            if (sequence == 0) {
                //阻塞到下一個毫秒,獲得新的時間戳
                timestamp = nextMillis(lastTimestamp);
            }
        } else {//時間戳改變，毫秒內序列重置
            sequence = 0L;
        }
        lastTimestamp = timestamp;
        //移位並通過按位或運算拼到一起組成64位的ID
        return ((timestamp - epoch) << timestampShift) |
                (dataCenterId << dataCenterIdShift) |
                (workerId << workerIdShift) |
                sequence;
    }

    /**
     * 返回以毫秒為單位的當前時間
     * @return 當前時間(毫秒)
     */
    protected long timeGen() {
        return System.currentTimeMillis();
    }

    /**
     * 阻塞到下一個毫秒，直到獲得新的時間戳
     * @param lastTimestamp 上次生成ID的時間截
     * @return 當前時間戳
     */
    protected long nextMillis(long lastTimestamp) {
        long timestamp = timeGen();
        while (timestamp <= lastTimestamp) {
            timestamp = lastTimestamp;
        }
        return timestamp;
    } 
}
複製程式碼

6. 百度UidGenerator

UidGenerator是百度開源的分散式ID生成器，基於於snowflake演算法的實現，看起來感覺還行。不過，國內開源的專案維護性真是擔憂。

具體可以參考官網說明：github.com/baidu/uid-g…

7. 美團Leaf

Leaf 是美團開源的分散式ID生成器，能保證全域性唯一性、趨勢遞增、單調遞增、資訊保安，裡面也提到了幾種分散式方案的對比，但也需要依賴關聯式資料庫、Zookeeper等中介軟體。

具體可以參考官網說明：tech.meituan.com/MT_Leaf.htm…

小結

這篇文章和大家分享了全域性id生成服務的幾種常用方案，同時對比了各自的優缺點和適用場景。在實際工作中，大家可以結合自身業務和系統架構體系進行合理選型。

歡迎掃碼關注公眾號：零壹技術棧

本帳號將持續分享後端技術乾貨，包括虛擬機器基礎，多執行緒程式設計，高效能框架，非同步、快取和訊息中介軟體，分散式和微服務，架構學習和進階等學習資料和文章。

生成分散式唯一ID的幾種解決方案
2018-07-26
分散式
分散式唯一id生成策略
2018-11-26
分散式
分散式唯一 ID 生成器
2020-06-17
分散式
分散式唯一 ID 生成器 - IDGen
2024-05-16
分散式
PHP 實現 Snowflake 生成分散式唯一 ID
2018-11-26
PHP分散式
分散式全域性ID生成方案
2019-07-08
分散式
研究分散式唯一ID生成，看完這篇就夠
2019-07-27
分散式
搞懂分散式技術12：分散式ID生成方案
2019-11-19
分散式
分散式唯一ID解決方案-雪花演算法
2021-01-12
分散式演算法
分散式全域性唯一ID
2021-06-21
分散式
分散式唯一ID生成方案選型！詳細解析雪花演算法Snowflake
2021-07-10
分散式演算法
分散式ID生成器的解決方案總結
2021-09-09
分散式
分庫分表的 9種分散式主鍵ID 生成方案，挺全乎的
2020-11-09
分散式
框架篇：分散式全域性唯一ID
2021-06-27
框架分散式
最常用的分散式ID解決方案，你知道幾個
2020-12-06
分散式
Redis實現分散式鎖的幾種方案
2023-03-01
Redis分散式
搞懂分散式技術16：淺談分散式鎖的幾種方案
2019-11-20
分散式
分散式ID設計方案
2024-11-27
分散式
分散式全域性ID生成方案彙總和對比
2021-01-03
分散式
怎樣生成分散式的流水ID
2022-06-02
分散式
開源專案｜Go 開發的一款分散式唯一 ID 生成系統
2021-11-09
Go分散式
全域性唯一ID生成常見的幾種方式和twitter/snowflake（雪花演算法）解析
2018-09-18
演算法
【高併發】之分散式全域性唯一 ID
2020-10-13
分散式
redis實現分散式id方案
2024-10-18
Redis分散式
探討分散式ID生成系統
2019-01-19
分散式
Leaf-分散式ID生成系統
2019-08-09
分散式
分散式 ID 生成演算法 — SnowFlake
2021-01-21
分散式演算法
講分散式唯一id，這篇文章很實在
2021-11-09
分散式
分散式系統唯一主鍵識別符號ID生成機制比較 - Encore
2022-03-26
分散式符號
預分配法生成唯一ID
2020-05-19
微服務之唯一ID生成策略
2019-08-01
微服務
Python 根據id生成唯一碼
2022-01-19
Python
圖解Janusgraph系列-分散式id生成策略分析
2020-09-01
圖解分散式
分散式id
2024-03-17
分散式
分散式鎖的幾種實現方式~
2018-04-13
分散式
探索 PHP 如何生成全域性唯一的 id
2020-01-10
PHP
Leaf：美團分散式ID生成服務開源
2019-03-08
分散式
Golang 分散式 ID 生成系統，高效能、高可用、易擴充套件的 id 生成服務
2020-06-10
Golang分散式套件