PHP 實現 Snowflake 生成分散式唯一 ID

Ryan發表於2018-11-26

Twitter 的 snowflake 在分散式生成唯一 UUID 應用還是蠻廣泛的,基於 snowflake 的一些變種的演算法網上也有不少。使用 snowflake 生成 UUID 很多都是在分散式場景下使用,我看了下網上有其中有幾篇 PHP 實現的都沒有考慮到執行緒安全。現在 PHP 有了 Swoole 的鎖和協程的加持,對於我們開發執行緒安全和高併發模擬還是很方便的,這裡用 PHP 結合 Swoole 來學習下實現最簡單的 snowflake(好久沒寫 PHP,感覺沒有 IDE 真寫不了 PHP 了)。

先來看以下 snowflake 的結構:
1543222572214

生成的數值是 64 位,分成 4 個部分:

  • 第一個 bit 為符號位,最高位為 0 表示正數
  • 第二部分 41 個 bit 用於記錄生成 ID 時候的時間戳,單位為毫秒,所以該部分表示的數值範圍為 2^41 - 1(69 年),它是相對於某一時間的偏移量
  • 第三部分的 10 個 bit 表示工作節點的 ID,表示數值範圍為 2^10 - 1,相當於支援 1024 個節點
  • 第四部分 12 個 bit 表示每個工作節點沒毫秒生成的迴圈自增 id,最多可以生成 2^12 -1 個 id,超出歸零等待下一毫秒重新自增

先貼下程式碼:

<?php

class Snowflake
{
    const EPOCH = 1543223810238;    // 起始時間戳,毫秒

    const SEQUENCE_BITS = 12;   //序號部分12位
    const SEQUENCE_MAX = -1 ^ (-1 << self::SEQUENCE_BITS);  // 序號最大值

    const WORKER_BITS = 10; // 節點部分10位
    const WORKER_MAX = -1 ^ (-1 << self::WORKER_BITS);  // 節點最大數值

    const TIME_SHIFT = self::WORKER_BITS + self::SEQUENCE_BITS; // 時間戳部分左偏移量
    const WORKER_SHIFT = self::SEQUENCE_BITS;   // 節點部分左偏移量

    protected $timestamp;   // 上次ID生成時間戳
    protected $workerId;    // 節點ID
    protected $sequence;    // 序號
    protected $lock;        // Swoole 互斥鎖

    public function __construct($workerId)
    {
        if ($workerId < 0 || $workerId > self::WORKER_MAX) {
            trigger_error("Worker ID 超出範圍");
            exit(0);
        }

        $this->timestamp = 0;
        $this->workerId = $workerId;
        $this->sequence = 0;
        $this->lock = new swoole_lock(SWOOLE_MUTEX);
    }

    /**
     * 生成ID
     * @return int
     */
    public function getId()
    {
        $this->lock->lock();    // 這裡一定要記得加鎖
        $now = $this->now();
        if ($this->timestamp == $now) {
            $this->sequence++;

            if ($this->sequence > self::SEQUENCE_MAX) {
                // 當前毫秒內生成的序號已經超出最大範圍,等待下一毫秒重新生成
                while ($now <= $this->timestamp) {
                    $now = $this->now();
                }
            }
        } else {
            $this->sequence = 0;
        }

        $this->timestamp = $now;    // 更新ID生時間戳

        $id = (($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;
        $this->lock->unlock();  //解鎖

        return $id;
    }

    /**
     * 獲取當前毫秒
     * @return string
     */
    public function now()
    {
        return sprintf("%.0f", microtime(true) * 1000);
    }

}

其實邏輯並不複雜,解釋一下程式碼中的位運算:

-1 ^ (-1 << self::SEQUENCE_BITS)
就是-1的二進位制表示為1的補碼,其實等同於 :
2**self::SEQUENCE_BITS - 1

最後部分左移後或運算:

(($now - self::EPOCH) << self::TIME_SHIFT) | ($this->workerId << self::WORKER_SHIFT) | $this->sequence;

這裡主要是對除了第一位符號位以外的三個部分進行左移相應的偏移量使其歸位,並透過或運算重新整合成上面 snowflake 的結構,比如我們用 3 部分 4 位來演示一下該歸併操作:

0000 0000 0010  --左移0位--> 0000 0000 0010
0000 0000 0100  --左移4位--> 0000 0100 0000 --或操作-->1000 0100 0010
0000 0000 1000  --左移8位--> 1000 0000 0000

下面藉助 Swoole 的協程和 channel 來暴力測試一下,看看生成的 ID 是否會出現重複的狀況:

$snowflake = new Snowflake(1);

$chan = new chan(100000);
$n = 100000;

for ($i = 0; $i < $n; $i++) {
    go(function () use ($snowflake, $chan) {
        $id = $snowflake->getId();
        $chan->push($id);
    });
}

go(function () use ($chan, $n) {
    $arr = [];
    for ($i = 0; $i < $n; $i++) {
        $id = $chan->pop();  // PHP Swoole的channel一定要寫在go(func)的協程裡面!?
        if (in_array($id, $arr)) {
            exit("ID 已存在");
        }
        array_push($arr, $id);
    }
});

$chan->close();

echo "ok";

跑了一下,確實不會出現重複的 ID,對了,我用 Golang 同樣實現了 snowflake 並協程式方式跑了同樣的測試,PHP 的執行時間是大約 12 秒左右,Golang 只需要 1 秒。文章有什麼錯誤還請指正,謝謝。

轉載請註明: 轉載自Ryan 是菜鳥 | LNMP 技術棧筆記

如果覺得本篇文章對您十分有益,何不 打賞一下

謝謝打賞

本文連結地址: PHP 實現 Snowflake 生成分散式唯一 ID

本作品採用《CC 協議》,轉載必須註明作者和本文連結

相關文章