Leaf：美團分散式ID生成服務開源

美團技術團隊發表於2019-03-08

原文網址 : http://juejin.im/post/5c8220d86fb9a049d4429c01

Leaf是美團基礎研發平臺推出的一個分散式ID生成服務，名字取自德國哲學家、數學家萊布尼茨的一句話：“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全域性唯一等特點。目前已經廣泛應用於美團金融、美團外賣、美團酒旅等多個部門。具體的技術細節，可參考此前美團技術部落格的一篇文章：《Leaf美團分散式ID生成服務》。近日，Leaf專案已經在Github上開源：github.com/Meituan-Dia…，希望能和更多的技術同行一起交流、共建。

Leaf特性

Leaf在設計之初就秉承著幾點要求：

全域性唯一，絕對不會出現重複的ID，且ID整體趨勢遞增。
高可用，服務完全基於分散式架構，即使MySQL當機，也能容忍一段時間的資料庫不可用。
高併發低延時，在CentOS 4C8G的虛擬機器上，遠端呼叫QPS可達5W+，TP99在1ms內。
接入簡單，直接通過公司RPC服務或者HTTP呼叫即可接入。

Leaf誕生

Leaf第一個版本採用了預分發的方式生成ID，即可以在DB之上掛N個Server，每個Server啟動時，都會去DB拿固定長度的ID List。這樣就做到了完全基於分散式的架構，同時因為ID是由記憶體分發，所以也可以做到很高效。接下來是資料持久化問題，Leaf每次去DB拿固定長度的ID List，然後把最大的ID持久化下來，也就是並非每個ID都做持久化，僅僅持久化一批ID中最大的那一個。這個方式有點像遊戲裡的定期存檔功能，只不過存檔的是未來某個時間下發給使用者的ID，這樣極大地減輕了DB持久化的壓力。

整個服務的具體處理過程如下：

Leaf Server 1：從DB載入號段[1，1000]。
Leaf Server 2：從DB載入號段[1001，2000]。
Leaf Server 3：從DB載入號段[2001，3000]。

使用者通過Round-robin的方式呼叫Leaf Server的各個服務，所以某一個Client獲取到的ID序列可能是：1，1001，2001，2，1002，2002......也可能是：1，2，1001，2001，2002，2003，3，4......當某個Leaf Server號段用完之後，下一次請求就會從DB中載入新的號段，這樣保證了每次載入的號段是遞增的。

Leaf資料庫中的號段表格式如下：

+-------------+--------------+------+-----+-------------------+-----------------------------+
| Field       | Type         | Null | Key | Default           | Extra                       |
+-------------+--------------+------+-----+-------------------+-----------------------------+
| biz_tag     | varchar(128) | NO   | PRI |                   |                             |
| max_id      | bigint(20)   | NO   |     | 1                 |                             |
| step        | int(11)      | NO   |     | NULL              |                             |
| desc        | varchar(256) | YES  |     | NULL              |                             |
| update_time | timestamp    | NO   |     | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP |
+-------------+--------------+------+-----+-------------------+-----------------------------+
複製程式碼

Leaf Server載入號段的SQL語句如下：

Begin
UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx
SELECT tag, max_id, step FROM table WHERE biz_tag=xxx
Commit
複製程式碼

整體上，V1版本實現比較簡單，主要是為了儘快解決業務層DB壓力的問題，而快速迭代出的一個版本。因而在生產環境中，也發現了些問題。比如：

在更新DB的時候會出現耗時尖刺，系統最大耗時取決於更新DB號段的時間。
當更新DB號段的時候，如果DB當機或者發生主從切換，會導致一段時間的服務不可用。

Leaf雙Buffer優化

為了解決這兩個問題，Leaf採用了非同步更新的策略，同時通過雙Buffer的方式，保證無論何時DB出現問題，都能有一個Buffer的號段可以正常對外提供服務，只要DB在一個Buffer的下發的週期內恢復，就不會影響整個Leaf的可用性。

這個版本程式碼線上上穩定執行了半年左右，Leaf又遇到了新的問題：

號段長度始終是固定的，假如Leaf本來能在DB不可用的情況下，維持10分鐘正常工作，那麼如果流量增加10倍就只能維持1分鐘正常工作了。
號段長度設定的過長，導致快取中的號段遲遲消耗不完，進而導致更新DB的新號段與前一次下發的號段ID跨度過大。

Leaf動態調整Step

假設服務QPS為Q，號段長度為L，號段更新週期為T，那麼Q * T = L。最開始L長度是固定的，導致隨著Q的增長，T會越來越小。但是Leaf本質的需求是希望T是固定的。那麼如果L可以和Q正相關的話，T就可以趨近一個定值了。所以Leaf每次更新號段的時候，根據上一次更新號段的週期T和號段長度step，來決定下一次的號段長度nextStep：

T < 15min，nextStep = step * 2
15min < T < 30min，nextStep = step
T > 30min，nextStep = step / 2

至此，滿足了號段消耗穩定趨於某個時間區間的需求。當然，面對瞬時流量幾十、幾百倍的暴增，該種方案仍不能滿足可以容忍資料庫在一段時間不可用、系統仍能穩定執行的需求。因為本質上來講，Leaf雖然在DB層做了些容錯方案，但是號段方式的ID下發，最終還是需要強依賴DB。

MySQL高可用

在MySQL這一層，Leaf目前採取了半同步的方式同步資料，通過公司DB中介軟體Zebra加MHA做的主從切換。未來追求完全的強一致，會考慮切換到MySQL Group Replication。

現階段由於公司資料庫強一致的特性還在演進中，Leaf採用了一個臨時方案來保證機房斷網場景下的資料一致性：

多機房部署資料庫，每個機房一個例項，保證都是跨機房同步資料。
半同步超時時間設定到無限大，防止半同步方式退化為非同步複製。

Leaf監控

針對服務自身的監控，Leaf提供了Web層的記憶體資料對映介面，可以實時看到所有號段的下發狀態。比如每個號段雙buffer的使用情況，當前ID下發到了哪個位置等資訊都可以在Web介面上檢視。

Leaf Snowflake

Snowflake，Twitter開源的一種分散式ID生成演算法。基於64位數實現，下圖為Snowflake演算法的ID構成圖。

第1位置為0。
第2-42位是相對時間戳，通過當前時間戳減去一個固定的歷史時間戳生成。
第43-52位是機器號workerID，每個Server的機器ID不同。
第53-64位是自增ID。

這樣通過時間+機器號+自增ID的組合來實現了完全分散式的ID下發。

在這裡，Leaf提供了Java版本的實現，同時對Zookeeper生成機器號做了弱依賴處理，即使Zookeeper有問題，也不會影響服務。Leaf在第一次從Zookeeper拿取workerID後，會在本機檔案系統上快取一個workerID檔案。即使ZooKeeper出現問題，同時恰好機器也在重啟，也能保證服務的正常執行。這樣做到了對第三方元件的弱依賴，一定程度上提高了SLA。

未來規劃

號段載入優化：Leaf目前重啟後的第一次請求還是會同步載入MySQL，之所以這麼做而非服務初始化載入號段的原因，主要是MySQL中的Leaf Key並非一定都被這個Leaf服務節點所載入，如果每個Leaf節點都在初始化載入所有的Leaf Key會導致號段的大量浪費。因此，未來會在Leaf服務Shutdown時，備份這個服務節點近一天使用過的Leaf Key列表，這樣重啟後會預先從MySQL載入Key List中的號段。
單調遞增：簡易的方式，是隻要保證同一時間、同一個Leaf Key都從一個Leaf服務節點獲取ID，即可保證遞增。需要注意的問題是Leaf服務節點切換時，舊Leaf 服務用過的號段需要廢棄。路由邏輯，可採用主備的模型或者每個Leaf Key 配置路由表的方式來實現。

關於開源

分散式ID生成的方案有很多種，Leaf開源版本提供了兩種ID的生成方式：

號段模式：低位趨勢增長，較少的ID號段浪費，能夠容忍MySQL的短時間不可用。
Snowflake模式：完全分散式，ID有語義。

讀者可以按需選擇適合自身業務場景的ID下發方式。希望美團的方案能給予大家一些幫助，同時也希望各位能夠一起交流、共建。

Leaf專案Github地址：github.com/Meituan-Dia… 。

如有任何疑問和問題，歡迎提交至Github issues。

分散式 ID 解決方案之美團 Leaf
2020-07-22
分散式
Leaf-分散式ID生成系統
2019-08-09
分散式
分散式ID生成服務，真的有必要搞一個
2020-07-22
分散式
Golang 分散式 ID 生成系統，高效能、高可用、易擴充套件的 id 生成服務
2020-06-10
Golang分散式套件
不能錯過的分散式ID生成器（Leaf ），好用的一批！
2020-08-07
分散式
冰河開源了全網首個完全開源的分散式全域性有序序列號（分散式ID）框架！！
2020-12-06
分散式框架
分散式id
2024-03-17
分散式
分散式ID系列（2）——UUID適合做分散式ID嗎
2019-08-06
分散式UI
阿里分散式事務框架GTS開源啦！
2019-01-12
阿里分散式框架
SEQSVR：Go + MySQL 實現的高效能 ID 生成服務
2018-07-02
VRGoMySql
[開源] Golang 實現的分散式 WebSocket 微服務
2020-01-15
Golang分散式Web微服務
分散式ID系列（3）——資料庫自增ID機制適合做分散式ID嗎
2019-08-07
分散式資料庫
開源專案｜Go 開發的一款分散式唯一 ID 生成系統
2021-11-09
Go分散式
微服務分散式事務解決方案-開源軟體seata
2024-06-27
微服務分散式
分散式ID設計方案
2024-11-27
分散式
開源|ns4_frame分散式服務框架開發指南
2019-04-18
分散式框架
.net core 自帶分散式事務的微服務開源框架JMS
2020-07-23
分散式微服務框架
搞懂分散式技術12：分散式ID生成方案
2019-11-19
分散式
阿里巴巴開源分散式事務解決方案 Fescar
2019-01-12
阿里分散式
來了！阿里開源分散式事務解決方案Fescar
2019-01-24
阿里分散式
來了！阿里開源分散式事務解決方案 Fescar
2019-01-25
阿里分散式
開源分散式任務排程系統就選：DolphinScheduler
2023-02-28
分散式
分散式唯一id生成策略
2018-11-26
分散式
redis實現分散式id方案
2024-10-18
Redis分散式
分散式全域性唯一ID
2021-06-21
分散式
.NET開源分散式鎖DistributedLock
2023-04-28
分散式
分散式ID系列（5）——Twitter的雪法演算法Snowflake適合做分散式ID嗎
2019-08-14
分散式演算法
快速瞭解阿里微服務熱門開源分散式事務框架——Seata
2020-11-12
阿里微服務分散式框架
阿里巴巴開源分散式事務解決方案 FESCAR【轉】
2019-01-13
阿里分散式
剛柔並濟的開源分散式事務解決方案
2019-01-29
分散式
.NET開源的處理分散式事務的解決方案
2023-11-30
分散式
探討分散式ID生成系統
2019-01-19
分散式
分散式唯一 ID 生成器
2020-06-17
分散式
分散式全域性ID生成方案
2019-07-08
分散式
分散式系統中ID的需求
2019-04-26
分散式
一文詳解分散式 ID
2024-06-19
分散式
分散式 ID 生成演算法 — SnowFlake
2021-01-21
分散式演算法
WMRouter：美團外賣Android開源路由框架
2018-08-24
Android路由框架