分散式唯一 ID 生成器

不溫柔發表於2020-06-17

原文網址 : https://learnku.com/articles/46042?order_by=created_at&

分散式

分散式唯一ID生成器
在應用程式中，經常需要全域性唯一的ID作為資料庫主鍵。如何生成全域性唯一ID？

首先，需要確定全域性唯一ID是整型還是字串？如果是字串，那麼現有的UUID就完全滿足需求，不需要額外的工作。缺點是字串作為ID佔用空間大，索引效率比整型低。

如果採用整型作為ID，那麼首先排除掉32位int型別，因為範圍太小，必須使用64位long型。

採用整型作為ID時，如何生成自增、全域性唯一且不重複的ID？

方案一：利用資料庫的自增ID，從1開始，基本可以做到連續遞增。Oracle可以用SEQUENCE，MySQL可以用主鍵的AUTO_INCREMENT，雖然不能保證全域性唯一，但每個表唯一，也基本滿足需求。

資料庫自增ID的缺點是資料在插入前，無法獲得ID。資料在插入後，獲取的ID雖然是唯一的，但一定要等到事務提交後，ID才算是有效的。有些雙向引用的資料，不得不插入後再做一次更新，比較麻煩。

第二種方式是採用一個集中式ID生成器，它可以是Redis，也可以是ZooKeeper，也可以利用資料庫的表記錄最後分配的ID。

這種方式最大的缺點是複雜性太高，需要嚴重依賴第三方服務，而且程式碼配置繁瑣。一般來說，越是複雜的方案，越不可靠，並且測試越痛苦。

第三種方式是類似Twitter的Snowflake演算法，它給每臺機器分配一個唯一標識，然後通過時間戳+標識+自增實現全域性唯一ID。這種方式好處在於ID生成演算法完全是一個無狀態機，無網路呼叫，高效可靠。缺點是如果唯一標識有重複，會造成ID衝突。

Snowflake演算法採用41bit毫秒時間戳，加上10bit機器ID，加上12bit序列號，理論上最多支援1024臺機器每秒生成4096000個序列號，對於Twitter的規模來說夠用了。

但是對於絕大部分普通應用程式來說，根本不需要每秒超過400萬的ID，機器數量也達不到1024臺，所以，我們可以改進一下，使用更短的ID生成方式：

53bitID由32bit秒級時間戳+16bit自增+5bit機器標識組成，累積32臺機器，每秒可以生成6.5萬個序列號，核心程式碼：

private static synchronized long nextId(long epochSecond) {
    if (epochSecond < lastEpoch) {
        // warning: clock is turn back:
        logger.warn("clock is back: " + epochSecond + " from previous:" + lastEpoch);
        epochSecond = lastEpoch;
    }
    if (lastEpoch != epochSecond) {
        lastEpoch = epochSecond;
        reset();
    }
    offset++;
    long next = offset & MAX_NEXT;
    if (next == 0) {
        logger.warn("maximum id reached in 1 second in epoch: " + epochSecond);
        return nextId(epochSecond + 1);
    }
    return generateId(epochSecond, next, SHARD_ID);
}

時間戳減去一個固定值，此方案最高可支援到2106年。

如果每秒6.5萬個序列號不夠怎麼辦？沒關係，可以繼續遞增時間戳，向前“借”下一秒的6.5萬個序列號。

同時還解決了時間回撥的問題。

機器標識採用簡單的主機名方案，只要主機名符合host-1，host-2就可以自動提取機器標識，無需配置。

最後，為什麼採用最多53位整型，而不是64位整型？這是因為考慮到大部分應用程式是Web應用，如果要和JavaScript打交道，由於JavaScript支援的最大整型就是53位，超過這個位數，JavaScript將丟失精度。因此，使用53位整數可以直接由JavaScript讀取，而超過53位時，就必須轉換成字串才能保證JavaScript處理正確，這會給API介面帶來額外的複雜度。這也是為什麼新浪微博的API介面會同時返回id和idstr的原因。

參考原始碼：
IdUtil.java
廖雪峰部落格

本作品採用《CC 協議》，轉載必須註明作者和本文連結

分散式唯一 ID 生成器 - IDGen
2024-05-16
分散式
分散式唯一id生成策略
2018-11-26
分散式
分散式全域性唯一ID
2021-06-21
分散式
框架篇：分散式全域性唯一ID
2021-06-27
框架分散式
PHP 實現 Snowflake 生成分散式唯一 ID
2018-11-26
PHP分散式
【高併發】之分散式全域性唯一 ID
2020-10-13
分散式
分散式唯一ID的幾種生成方案
2023-02-19
分散式
研究分散式唯一ID生成，看完這篇就夠
2019-07-27
分散式
講分散式唯一id，這篇文章很實在
2021-11-09
分散式
分散式唯一ID解決方案-雪花演算法
2021-01-12
分散式演算法
分散式ID生成器的解決方案總結
2021-09-09
分散式
生成分散式唯一ID的幾種解決方案
2018-07-26
分散式
分散式id
2024-03-17
分散式
分散式ID系列（2）——UUID適合做分散式ID嗎
2019-08-06
分散式UI
Spring Boot 工程整合全域性唯一ID生成器 Vesta
2018-11-21
Spring Boot
5 大分散式 ID 生成器優缺點簡單對比
2019-03-12
分散式
分散式系統全域性唯一Id(SnowFlake)雪花演算法實現
2020-12-15
分散式演算法
不能錯過的分散式ID生成器（Leaf ），好用的一批！
2020-08-07
分散式
分散式ID系列（3）——資料庫自增ID機制適合做分散式ID嗎
2019-08-07
分散式資料庫
分散式唯一ID生成方案選型！詳細解析雪花演算法Snowflake
2021-07-10
分散式演算法
分散式：分散式系統下的唯一序列
2022-01-24
分散式
分散式ID設計方案
2024-11-27
分散式
分散式系統唯一主鍵識別符號ID生成機制比較 - Encore
2022-03-26
分散式符號
開源專案｜Go 開發的一款分散式唯一 ID 生成系統
2021-11-09
Go分散式
搞懂分散式技術12：分散式ID生成方案
2019-11-19
分散式
redis實現分散式id方案
2024-10-18
Redis分散式
分散式ID系列（5）——Twitter的雪法演算法Snowflake適合做分散式ID嗎
2019-08-14
分散式演算法
探討分散式ID生成系統
2019-01-19
分散式
Leaf-分散式ID生成系統
2019-08-09
分散式
分散式全域性ID生成方案
2019-07-08
分散式
分散式系統中ID的需求
2019-04-26
分散式
一文詳解分散式 ID
2024-06-19
分散式
分散式 ID 生成演算法 — SnowFlake
2021-01-21
分散式演算法
修改安卓ID為硬體唯一ID
2023-02-23
安卓
分散式雪花演算法獲取id
2020-10-26
分散式演算法
怎樣生成分散式的流水ID
2022-06-02
分散式
預分配法生成唯一ID
2020-05-19
面試基礎之：叢集高併發情況下如何保證分散式唯一全域性Id生成
2020-11-23
面試分散式

分散式唯一 ID 生成器

相關文章