IM 去中心化概念模型與架構設計

mindwind發表於2019-03-03

原文網址 : https://flycode.co/archives/278429

今天打算寫寫關於 IM 去中心化涉及的架構模型變化和設計思路，去中心化的概念就是說使用者的訪問不是集中在一個資料中心，這裡的去中心是針對資料中心而言的。

站在這個角度而言，實際上並非所有的業務都能做去中心化設計，對於一致性要求越高的業務去中心化越難做。比如電商領域的庫存就是一個對一致性要求很高的業務，不能超賣也不能少賣，這在單中心容易實現，但多中心純從技術層面感覺無解，可能需要從業務和技術層面一起去做個折衷。

反過來看 IM 的業務場景是非常適合做去中心化設計的，因為其業務場景都是弱一致性需求。開啟你的微信或 QQ 仔細觀察下，對大部分人來說與你聯絡最頻繁的實際多是在地域上離你最近的人，人與人之間的心理距離和物理距離會隨著時間漸趨保持一致。所以根據這個特點，按地域來分佈資料中心和聚合人群是比較合適的。

在進入去中心化 IM 架構模型之前，我們先看看中心化架構是怎樣的，分析其關鍵設計再來看如果要去中心化需要做哪些變化？

中心化

IM 的中心化架構並不意味著只有一個資料中心，它也可以是多資料中心的，如下圖。

之所以說它是中心化架構，關鍵特徵是其存在共享的資料儲存。部署在兩個資料中心的應用需要共享訪問統一的資料儲存，而這種共享訪問實際是依賴資料中心之間的專線連通，這樣的架構也限制了能選取的資料中心地理位置的距離。而實現去中心架構的關鍵點就在於規避跨資料中心的共享儲存訪問，使得應用在其自身資料中心實現訪問閉環。

我們這裡只分析下實現 IM 訊息互通這個最重要場景下共享資料儲存裡需要存些什麼資料呢？一個是使用者上線後的「座標」，主要指使用者本次線上接入了哪臺機器的哪根連線，這個「座標」用於線上訊息投遞。而另一方面若使用者離線時，別人給它發訊息，這些訊息也需要儲存下來，一般稱為使用者的「離線訊息」，下次使用者上線就可以自動收取自己的離線訊息。

中心化架構實際能做到的極致就是把讀實現自有資料中心閉環，而寫依然需要向主資料中心所在的儲存寫入。而 IM 的寫入場景還不算是一個低頻操作，那麼要實現去中心化架構關鍵點就在如何解決寫的問題上。

去中心化

在設計 IM 的去中心化架構之前，希望去實現這個架構並編寫程式碼時，不需要去考慮最終部署到底是去中心的還是中心的。編碼時就像開發中心化架構一樣去實現場景的功能，而去中心化的能力做為純基礎的技術能力，通過附加的方式來獲得，先看看架構圖的變化，如下。

這裡的變化是為「座標」增加一個「資料中心」緯度，當按通用的方式去本地儲存定位使用者時，發現一個非本地的座標時訊息該怎麼投遞？這裡可以在每個本地資料中心額外新增一個訊息閘道器程式，註冊到本地儲存中，並負責接收所有非本地座標的訊息，這有點像路由網路中的邊界閘道器。

訊息閘道器統一接收應當發往其他資料中心的訊息，以實現跨資料中心的訊息流轉。這裡有個疑問是其他資料中心的「座標」是怎麼跑到本地來的？離線訊息的場景又該如何處理呢？關於這兩個問題，就涉及到我們解決跨資料中心同步資料的關鍵技術了。

關鍵技術

結合 IM 的業務場景，實際它對同步的延時具有一定的容忍度。所以我覺得基於 Gossip 協議的小道訊息傳播特性就能很好的滿足這個同步場景。

關於 Gossip 我是在新近的 NoSQL 資料庫 Cassandra 上聽說的，後來 Redis Cluster 也利用了該協議來實現無中心化叢集架構。但 Gossip 協議可不是什麼新東西，實際關於它的誕生可以追溯到好幾十年前的施樂研究中心，就是為了解決資料庫同步問題被我們的前前前輩想出來的。

這個協議的靈感來自於辦公室小道訊息的傳播路徑，當一個人知道了一條小道訊息，他碰到一個朋友並隨口告訴了他，朋友又告訴了朋友的朋友，沒多久整個辦公室都知道了，也就完成了資訊的同步。借用這個模型，實際上我們需要同步的資訊就是使用者的線上「座標」和「離線訊息」。

因為 Gossip 自好幾十年前已經有很多論文證明並公開發表，而且近年也有 Cassandra 和 Redis 的成功工程實踐，所以我就先不用去懷疑其可行性，而是直接利用其結論了。根據其特性，分析 IM 的去中心場景在引入 Gossip 後有些什麼可供觀察的變化和值得注意的方面。

在一個稍具規模的 IM 場景下，使用者總是在上上下下，訊息也在不停的在「線上」和「離線」之間變化，所以需要通過 Gossip 同步的資訊是時時存在的。所以假設我們在某個時刻去拍一個快照（實際做不到），得到的結果是多個資料中心的資料肯定是不一致的，幾乎不存在所謂的全域性最終一致性的某一時刻。在這樣的客觀環境下，對 IM 的業務場景有多大影響？

當使用者A在 IDC#1 線上，使用者B 在 IDC#2 剛上線，這裡存在一個同步時差，那麼此時使用者A給使用者B發訊息，在本地沒有使用者B的座標，所以進入離線訊息池。使用者B此時不能立刻收到使用者A的訊息，但離線訊息池會在隨後通過 Gossip 協議同步到使用者B所在的 IDC#2，使用者B此時就可以通過離線訊息收取使用者A的訊息。

上面描述了一種臨界場景，在這種臨界場景下，使用者收訊息存在延時。而這種臨界場景實際上並不是常態，而且 IM 使用者實際對這種剛上線的訊息延時存在很高的容忍度。這一點我想大家用 QQ 可能體會過，有時一上線都一分鐘了，還會收到之前的離線訊息，我不知道這是有意的延時還是真有這麼長的系統延時。

那麼使用 Gossip 協議從理論上來估算下會產生多久的延時？假設我們在全國東西南北中各部署一個資料中心，一共五個。五個資料中心之間無專線，走公網互通，網路延時最大 200 ms。使用 Gossip 完成在五個資料中心的最終一致性同步最大需要多長時間？這裡我直接引用 Gossip 論文結論：

Cycles = log(N) + ln(N) + O(1)

當 N=5 時，完成全部同步，需要節點間私下傳播的次數，套用公式得到 3.3 次，取整得 4 次。按最大網路延時 200 ms，每次 Gossip 交換資訊間隔 100 ms，那麼協議本身固有延時大約 4x200 + 4x100 = 1.2s，而再算上程式開銷，這個延時很可能在數秒內波動，這個量級的延時對於少數的臨界場景是完全可以接受的。

總結

本文的標題是概念模型，但它不像另外一篇《RPC 的概念模型與實現解析》跟了實現解析，說明這只是一個理論推導。因為裡面最關鍵的是如何配合 Gossip 的共享儲存似乎沒有找到特別適合的產品，要是自己做一個呢就會產生一種今天只想出去兜兜風，卻要先自己動手造輛車的感覺。

參考

[1]. Wikipedia. Gossip protocol. 2016.03.29
[2]. ALVARO VIDELA. GOSSIP PROTOCOLS, WHERE TO START. 2015.12.02
[3]. Anne-Marie et al. Gossiping in Distributed Systems. 2007
[4]. Márk Jelasity. Gossip Protocols
[5]. Alberto Montresor. Gossip protocols for large-scale distributed systems. 2010

寫點程式世間的文字，畫點生活瞬間的畫兒。微信公眾號「瞬息之間」，遇見了不妨就關注看看。

去中心化基礎架構安全嘗試
2019-07-08
中心化架構
去中心化的前端構建工具 — Vite
2022-06-08
中心化前端Vite
Vue 專案架構設計與工程化實踐
2018-07-25
Vue架構
談談GIFTO（GTO）區塊鏈的去中心化設計
2021-10-27
區塊鏈中心化
探探的IM長連線技術實踐：技術選型、架構設計、效能優化
2021-12-16
架構優化
高併發IM系統架構優化實踐
2018-06-11
架構優化
Golang IM架構聊天開發
2024-10-13
Golang架構
架構設計思想-微服務架構設計模式
2020-06-24
架構微服務設計模式
使用者中心，1億資料，架構如何設計？
2020-07-16
架構
.NET SAAS 架構與設計 -SqlSugar ORM
2021-12-05
架構SqlSugarORM
iOS 元件化/模組化架構設計實踐
2021-10-31
iOS元件化架構
HBase+Elasticsearch，百億級資料中心架構設計實踐
2022-11-25
Elasticsearch架構
區塊鏈去中心化和傳統去中心化的區別
2018-09-04
區塊鏈中心化
領域驅動設計整合與架構
2024-04-04
架構
在AWS上的架構部署與設計
2020-09-21
架構
程式設計師如何切入區塊鏈去中心化應用開發
2018-09-05
程式設計師區塊鏈中心化
瓜子二手車封宇：瓜子IM智慧客服系統資料架構設計
2018-11-26
架構
如何利⽤結構化思考，去設計遊戲系統？
2021-10-11
遊戲
Android 架構設計：MVC、MVP、MVVM和元件化
2019-03-04
Android架構MVCMVPMVVM元件化
C4 模型 - 視覺化架構設計
2020-12-22
模型視覺化架構
架構設計之架構的演變
2024-06-15
架構
架構設計之一——基礎架構
2022-05-02
架構
3.17去中心化微博
2018-11-08
中心化
基於Gin的IM聊天架構——HiChat
2024-11-03
架構
Angular應用架構設計-5:設計原則與總結
2021-09-09
Angular應用架構
Apache Hudi 設計與架構最強解讀
2020-04-16
Apache架構
面向微服務架構設計理念與實踐
2024-10-29
微服務架構
架構師修煉之道（二）——架構？設計？架構師？
2019-07-22
架構
什麼是去中心化錢包？去中心化錢包是什麼意思？
2022-06-18
中心化
以資料庫為中心的架構與以領域為中心的架構的區別 - DevSDhami
2020-02-25
資料庫架構dev
阿里京東去哪兒網資料庫架構設計圖到手！
2018-05-07
阿里資料庫架構
專車架構進化往事：好的架構是進化來的，不是設計來的
2022-03-23
架構
【架構設計的藝術】Kafka如何通過精妙的架構設計優化JVM GC問題？【石杉的架構筆記】
2019-05-06
架構Kafka優化JVMGC筆記
「分散式技術專題」去中心化服務與中心化服務的優劣
2023-02-14
分散式中心化
遊戲架構遊戲架構設計(8)
2018-07-16
遊戲架構
SaaS架構：開放平臺架構設計
2024-10-12
架構
spring微服務架構設計與輕量級微服務架構及最佳部署
2019-03-03
Spring微服務架構
《架構整潔之道》第 1 章設計與架構究竟是什麼
2023-04-06
架構

IM 去中心化概念模型與架構設計

中心化

去中心化

關鍵技術

總結

參考

相關文章