四種框架分別實現百萬websocket常連線的伺服器

發表於2016-07-31

事實上，最近我又增加了幾個框架，現在包括 Netty, Undertow, Jetty, Spray, Vert.x, Grizzly 和 Node.js七種框架。
測試資料可以看下一篇文章: 七種WebSocket框架的效能比較

著名的 C10K 問題提出的時候, 正是 2001 年。這篇文章可以說是高效能伺服器開發的一個標誌性文件，它討論的就是單機為1萬個連線提供服務這個問題，當時因為硬體和軟體的限制，單機1萬還是一個非常值得挑戰的目標。但是時光荏苒，隨著硬體和軟體的飛速發展，單機1萬的目標已經變成了最簡單不過的事情。

現在用任何一種主流語言都能提供單機1萬的併發處理的能力。所以現在目標早已提高了100倍，變成C1000k，也就是一臺伺服器為100萬連線提供服務。在2010年,2011年已經看到一些實現C1000K的文章了，所以在2015年，實現C1000K應該不是一件困難的事情。

本文是我在實踐過程中的記錄，我的目標是使用spran-websocket，netty, undertow和node.js四種框架分別實現C1000K的伺服器，看看這幾個框架實現的難以程度，效能如何。開發語言為Scala和Javascript。

當然，談起效能，我們還必須談到每秒每個連線有多少個請求，也就是RPS數，還要考慮每條訊息的大小。
一般來說，我們會選取一個百分比，比如每秒20%的連線會收發訊息。我的需求是伺服器只是push,客戶端不會主動傳送訊息。一般每一分鐘會為這一百萬群發一條訊息。

所以實現的測試工具每個client建立60000個websocket連線，一共二十個client。實際不可能使用20臺機器，我使用了兩臺AWS C3.2xlarge(8核16G)伺服器作為客戶端機。每臺機器10個客戶端。
伺服器每1分鐘群發一條訊息。訊息內容很簡單，只是伺服器的當天時間。

最近看到360用Go實現的訊息推送系統，下面是他們的資料：

目前360訊息推送系統服務於50+內部產品，萬款開發平臺App，實時長連線數億量級，日獨數十億量級，1分鐘內可以實現億量級廣播，日下發峰值百億量級，400臺物理機，3000多個例項分佈在9個獨立叢集中，每個叢集跨國內外近10個IDC。

四個伺服器的程式碼和Client測試工具程式碼可以在github上下載。 (其實不止四種框架了，現在包括Netty, Undertow, Jetty, Spray-websocket, Vert.x, Grizzly 和 Node.js 七種框架的實現)

測試下來可以看到每種伺服器都能輕鬆達到同時120萬的websocket活動連線，只是資源佔用和事務處理時間有差別。120萬隻是保守資料，在這麼多連線情況下伺服器依然很輕鬆，下一步我會進行C2000K的測試。

在測試之前我們需要對伺服器/客戶機的一些引數進行調優。

伺服器的引數調優

一般會修改兩個檔案，/etc/sysctl.conf和/etc/security/limits.conf，用來配置TCP/IP引數和最大檔案描述符。

TCP/IP引數配置

修改檔案/etc/sysctl.conf,配置網路引數。

net.ipv4.tcp_wmem = 4096 87380 4161536
net.ipv4.tcp_rmem = 4096 87380 4161536
net.ipv4.tcp_mem = 786432 2097152 3145728

net.ipv4.tcp_wmem = 4096 87380 4161536

net.ipv4.tcp_rmem = 4096 87380 4161536

net.ipv4.tcp_mem = 786432 2097152 3145728

數值根據需求進行調整。更多的引數可以看以前整理的一篇文章: Linux TCP/IP 協議棧調優。
執行/sbin/sysctl -p即時生效。

最大檔案描述符

Linux核心本身有檔案描述符最大值的限制，你可以根據需要更改：

系統最大開啟檔案描述符數：/proc/sys/fs/file-max
1. 臨時性設定：echo 1000000 > /proc/sys/fs/file-max
2. 永久設定：修改/etc/sysctl.conf檔案，增加fs.file-max = 1000000
程式最大開啟檔案描述符數
使用ulimit -n檢視當前設定。使用ulimit -n 1000000進行臨時性設定。
要想永久生效，你可以修改/etc/security/limits.conf檔案，增加下面的行：

* hard nofile 1000000
* soft nofile 1000000
root hard nofile 1000000
root soft nofile 1000000

* hard nofile 1000000

* soft nofile 1000000

root hard nofile 1000000

root soft nofile 1000000

還有一點要注意的就是hard limit不能大於/proc/sys/fs/nr_open，因此有時你也需要修改nr_open的值。
執行echo 2000000 > /proc/sys/fs/nr_open

檢視當前系統使用的開啟檔案描述符數，可以使用下面的命令：

[root@localhost ~]# cat /proc/sys/fs/file-nr
1632 0 1513506

1 2	[root@localhost ~]# cat /proc/sys/fs/file-nr 1632 0 1513506

其中第一個數表示當前系統已分配使用的開啟檔案描述符數，第二個數為分配後已釋放的（目前已不再使用），第三個數等於file-max。

總結一下：

所有程式開啟的檔案描述符數不能超過/proc/sys/fs/file-max
單個程式開啟的檔案描述符數不能超過user limit中nofile的soft limit
nofile的soft limit不能超過其hard limit
nofile的hard limit不能超過/proc/sys/fs/nr_open

應用執行時調優

Java 應用記憶體調優
伺服器使用12G記憶體，吞吐率優先的垃圾回收器：

2. V8引擎

node --nouse-idle-notification --expose-gc --max-new-space-size=1024 --max-new-space-size=2048 --max-old-space-size=8192 ./webserver.js

1	node --nouse-idle-notification --expose-gc --max-new-space-size=1024 --max-new-space-size=2048 --max-old-space-size=8192 ./webserver.js

OutOfMemory Killer

如果伺服器本身記憶體不大，比如8G，在不到100萬連線的情況下，你的伺服器程式有可能出現”Killed”的問題。執行dmesg可以看到

Out of memory: Kill process 10375 (java) score 59 or sacrifice child

1	Out of memory: Kill process 10375 (java) score 59 or sacrifice child

這是Linux的OOM Killer主動殺死的。開啟oom-killer的話，在/proc/pid下對每個程式都會多出3個與oom打分調節相關的檔案。臨時對某個程式可以忽略oom-killer可以使用下面的方式:
echo -17 > /proc/$(pidof java)/oom_adj
解決辦法有多種，可以參看文章最後的參考文章,最好是換一個記憶體更大的機器。

客戶端的引數調優

在一臺系統上，連線到一個遠端服務時的本地埠是有限的。根據TCP/IP協議，由於埠是16位整數，也就只能是0到 65535，而0到1023是預留埠，所以能分配的埠只是1024到65534，也就是64511個。也就是說，一臺機器一個IP只能建立六萬多個長連線。
要想達到更多的客戶端連線，可以用更多的機器或者網路卡，也可以使用虛擬IP來實現,比如下面的命令增加了19個IP地址，其中一個給伺服器用，其它18個給client,這樣
可以產生18 * 60000 = 1080000個連線。

ifconfig eth0:0 192.168.77.10 netmask 255.255.255.0 up
ifconfig eth0:1 192.168.77.11 netmask 255.255.255.0 up
ifconfig eth0:2 192.168.77.12 netmask 255.255.255.0 up
ifconfig eth0:3 192.168.77.13 netmask 255.255.255.0 up
ifconfig eth0:4 192.168.77.14 netmask 255.255.255.0 up
ifconfig eth0:5 192.168.77.15 netmask 255.255.255.0 up
ifconfig eth0:6 192.168.77.16 netmask 255.255.255.0 up
ifconfig eth0:7 192.168.77.17 netmask 255.255.255.0 up
ifconfig eth0:8 192.168.77.18 netmask 255.255.255.0 up
ifconfig eth0:9 192.168.77.19 netmask 255.255.255.0 up
ifconfig eth0:10 192.168.77.20 netmask 255.255.255.0 up
ifconfig eth0:11 192.168.77.21 netmask 255.255.255.0 up
ifconfig eth0:12 192.168.77.22 netmask 255.255.255.0 up
ifconfig eth0:13 192.168.77.23 netmask 255.255.255.0 up
ifconfig eth0:14 192.168.77.24 netmask 255.255.255.0 up
ifconfig eth0:15 192.168.77.25 netmask 255.255.255.0 up
ifconfig eth0:16 192.168.77.26 netmask 255.255.255.0 up
ifconfig eth0:17 192.168.77.27 netmask 255.255.255.0 up
ifconfig eth0:18 192.168.77.28 netmask 255.255.255.0 up

ifconfig eth0:0 192.168.77.10 netmask 255.255.255.0 up

ifconfig eth0:1 192.168.77.11 netmask 255.255.255.0 up

ifconfig eth0:2 192.168.77.12 netmask 255.255.255.0 up

ifconfig eth0:3 192.168.77.13 netmask 255.255.255.0 up

ifconfig eth0:4 192.168.77.14 netmask 255.255.255.0 up

ifconfig eth0:5 192.168.77.15 netmask 255.255.255.0 up

ifconfig eth0:6 192.168.77.16 netmask 255.255.255.0 up

ifconfig eth0:7 192.168.77.17 netmask 255.255.255.0 up

ifconfig eth0:8 192.168.77.18 netmask 255.255.255.0 up

ifconfig eth0:9 192.168.77.19 netmask 255.255.255.0 up

ifconfig eth0:10 192.168.77.20 netmask 255.255.255.0 up

ifconfig eth0:11 192.168.77.21 netmask 255.255.255.0 up

ifconfig eth0:12 192.168.77.22 netmask 255.255.255.0 up

ifconfig eth0:13 192.168.77.23 netmask 255.255.255.0 up

ifconfig eth0:14 192.168.77.24 netmask 255.255.255.0 up

ifconfig eth0:15 192.168.77.25 netmask 255.255.255.0 up

ifconfig eth0:16 192.168.77.26 netmask 255.255.255.0 up

ifconfig eth0:17 192.168.77.27 netmask 255.255.255.0 up

ifconfig eth0:18 192.168.77.28 netmask 255.255.255.0 up

修改/etc/sysctl.conf檔案：

net.ipv4.ip_local_port_range = 1024 65535

1	net.ipv4.ip_local_port_range = 1024 65535

執行/sbin/sysctl -p即時生效。

伺服器測試

實際測試中我使用一臺AWS C3.4xlarge (16 cores, 32G memory)作為應用伺服器，兩臺AWS C3.2xlarge (8 cores, 16G memory)伺服器作為客戶端。
這兩臺機器作為測試客戶端綽綽有餘，每臺客戶端機器建立了十個內網虛擬IP, 每個IP建立60000個websocket連線。

客戶端配置如下：
/etc/sysctl.conf配置

fs.file-max = 2000000
fs.nr_open = 2000000
net.ipv4.ip_local_port_range = 1024 65535

fs.file-max = 2000000

fs.nr_open = 2000000

net.ipv4.ip_local_port_range = 1024 65535

/etc/security/limits.conf配置

* soft nofile 2000000
* hard nofile 2000000
 
* soft nproc 2000000
* hard nproc 2000000

* soft nofile 2000000

* hard nofile 2000000

* soft nproc 2000000

* hard nproc 2000000

服務端配置如下：
/etc/sysctl.conf配置

fs.file-max = 2000000
fs.nr_open = 2000000
net.ipv4.ip_local_port_range = 1024 65535

fs.file-max = 2000000

fs.nr_open = 2000000

net.ipv4.ip_local_port_range = 1024 65535

/etc/security/limits.conf配置

* soft nofile 2000000
* hard nofile 2000000
 
* soft nproc 2000000
* hard nproc 2000000

* soft nofile 2000000

* hard nofile 2000000

* soft nproc 2000000

* hard nproc 2000000

Netty伺服器

建立120萬個連線，不傳送訊息，輕輕鬆鬆達到。記憶體還剩14G未用。

[roocolobu ~]# ss -s; free -m
Total: 1200231 (kernel 1200245)
TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4
 
Transport Total IP IPv6
* 1200245 - -
RAW 0 0 0
UDP 1 1 0
TCP 1200006 1200006 0
INET 1200007 1200007 0
FRAG 0 0 0
 
total used free shared buffers cached
Mem: 30074 15432 14641 0 9 254
-/+ buffers/cache: 15167 14906
Swap: 815 0 815

[roocolobu ~]# ss -s; free -m

Total: 1200231 (kernel 1200245)

TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4

Transport Total IP IPv6

* 1200245 - -

RAW 0 0 0

UDP 1 1 0

TCP 1200006 1200006 0

INET 1200007 1200007 0

FRAG 0 0 0

total used free shared buffers cached

Mem: 30074 15432 14641 0 9 254

-/+ buffers/cache: 15167 14906

Swap: 815 0 815

每分鐘給所有的120萬個websocket傳送一條訊息，訊息內容為當前的伺服器的時間。這裡傳送顯示是單執行緒傳送，伺服器傳送完120萬個總用時15秒左右。

02:15:43.307 [pool-1-thread-1] INFO com.colobu.webtest.netty.WebServer$ - send msg to channels for c4453a26-bca6-42b6-b29b-43653767f9fc
02:15:57.190 [pool-1-thread-1] INFO com.colobu.webtest.netty.WebServer$ - sent 1200000 channels for c4453a26-bca6-42b6-b29b-43653767f9fc

1 2	02:15:43.307 [pool-1-thread-1] INFO com.colobu.webtest.netty.WebServer$ - send msg to channels for c4453a26-bca6-42b6-b29b-43653767f9fc 02:15:57.190 [pool-1-thread-1] INFO com.colobu.webtest.netty.WebServer$ - sent 1200000 channels for c4453a26-bca6-42b6-b29b-43653767f9fc

傳送時CPU使用率並不高，網路頻寬佔用基本在10M左右。

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read writ| recv send| in out | int csw
0 0 100 0 0 0| 0 0 | 60B 540B| 0 0 | 224 440
0 0 100 0 0 0| 0 0 | 60B 870B| 0 0 | 192 382
0 0 100 0 0 0| 0 0 | 59k 74k| 0 0 |2306 2166
2 7 87 0 0 4| 0 0 |4998k 6134k| 0 0 | 169k 140k
1 7 87 0 0 5| 0 0 |4996k 6132k| 0 0 | 174k 140k
1 7 87 0 0 5| 0 0 |4972k 6102k| 0 0 | 176k 140k
1 7 87 0 0 5| 0 0 |5095k 6253k| 0 0 | 178k 142k
2 7 87 0 0 5| 0 0 |5238k 6428k| 0 0 | 179k 144k
1 7 87 0 0 5| 0 24k|4611k 5660k| 0 0 | 166k 129k
1 7 87 0 0 5| 0 0 |5083k 6238k| 0 0 | 175k 142k
1 7 87 0 0 5| 0 0 |5277k 6477k| 0 0 | 179k 146k
1 7 87 0 0 5| 0 0 |5297k 6500k| 0 0 | 179k 146k
1 7 87 0 0 5| 0 0 |5383k 6607k| 0 0 | 180k 148k
1 7 87 0 0 5| 0 0 |5504k 6756k| 0 0 | 184k 152k
1 7 87 0 0 5| 0 48k|5584k 6854k| 0 0 | 183k 152k
1 7 87 0 0 5| 0 0 |5585k 6855k| 0 0 | 183k 153k
1 7 87 0 0 5| 0 0 |5589k 6859k| 0 0 | 184k 153k
1 5 91 0 0 3| 0 0 |4073k 4999k| 0 0 | 135k 110k
0 0 100 0 0 0| 0 32k| 60B 390B| 0 0 |4822 424

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--

usr sys idl wai hiq siq| read writ| recv send| in out | int csw

0 0 100 0 0 0| 0 0 | 60B 540B| 0 0 | 224 440

0 0 100 0 0 0| 0 0 | 60B 870B| 0 0 | 192 382

0 0 100 0 0 0| 0 0 | 59k 74k| 0 0 |2306 2166

2 7 87 0 0 4| 0 0 |4998k 6134k| 0 0 | 169k 140k

1 7 87 0 0 5| 0 0 |4996k 6132k| 0 0 | 174k 140k

1 7 87 0 0 5| 0 0 |4972k 6102k| 0 0 | 176k 140k

1 7 87 0 0 5| 0 0 |5095k 6253k| 0 0 | 178k 142k

2 7 87 0 0 5| 0 0 |5238k 6428k| 0 0 | 179k 144k

1 7 87 0 0 5| 0 24k|4611k 5660k| 0 0 | 166k 129k

1 7 87 0 0 5| 0 0 |5083k 6238k| 0 0 | 175k 142k

1 7 87 0 0 5| 0 0 |5277k 6477k| 0 0 | 179k 146k

1 7 87 0 0 5| 0 0 |5297k 6500k| 0 0 | 179k 146k

1 7 87 0 0 5| 0 0 |5383k 6607k| 0 0 | 180k 148k

1 7 87 0 0 5| 0 0 |5504k 6756k| 0 0 | 184k 152k

1 7 87 0 0 5| 0 48k|5584k 6854k| 0 0 | 183k 152k

1 7 87 0 0 5| 0 0 |5585k 6855k| 0 0 | 183k 153k

1 7 87 0 0 5| 0 0 |5589k 6859k| 0 0 | 184k 153k

1 5 91 0 0 3| 0 0 |4073k 4999k| 0 0 | 135k 110k

0 0 100 0 0 0| 0 32k| 60B 390B| 0 0 |4822 424

客戶端(一共20個，這裡選取其中一個檢視它的指標)。每個客戶端保持6萬個連線。每個訊息從伺服器傳送到客戶端接收到總用時平均633毫秒，而且標準差很小，每個連線用時差不多。

Active WebSockets for eb810c24-8565-43ea-bc27-9a0b2c910ca4
count = 60000
WebSocket Errors for eb810c24-8565-43ea-bc27-9a0b2c910ca4
count = 0
 
-- Histograms ------------------------------------------------------------------
Message latency for eb810c24-8565-43ea-bc27-9a0b2c910ca4
count = 693831
min = 627
max = 735
mean = 633.06
stddev = 9.61
median = 631.00
75% 633.00
95% 640.00
98% 651.00
99% 670.00
99.9% 735.00
 
-- Meters ----------------------------------------------------------------------
Message Rate for eb810c24-8565-43ea-bc27-9a0b2c910ca4
count = 693832
mean rate = 32991.37 events/minute
1-minute rate = 60309.26 events/minute
5-minute rate = 53523.45 events/minute
15-minute rate = 31926.26 events/minute

Active WebSockets for eb810c24-8565-43ea-bc27-9a0b2c910ca4

count = 60000

WebSocket Errors for eb810c24-8565-43ea-bc27-9a0b2c910ca4

count = 0

-- Histograms ------------------------------------------------------------------

Message latency for eb810c24-8565-43ea-bc27-9a0b2c910ca4

count = 693831

min = 627

max = 735

mean = 633.06

stddev = 9.61

median = 631.00

75% 633.00

95% 640.00

98% 651.00

99% 670.00

99.9% 735.00

-- Meters ----------------------------------------------------------------------

Message Rate for eb810c24-8565-43ea-bc27-9a0b2c910ca4

count = 693832

mean rate = 32991.37 events/minute

1-minute rate = 60309.26 events/minute

5-minute rate = 53523.45 events/minute

15-minute rate = 31926.26 events/minute

平均每個client的RPS = 1000, 總的RPS大約為 20000 requests /seconds.
latency平均值為633 ms，最長735 ms，最短627ms。

Spray伺服器

建立120萬個連線，不傳送訊息，輕輕鬆鬆達到。它的記憶體相對較高，記憶體還剩7G。

# ss -s; free -m
Total: 1200234 (kernel 1200251)
TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4
 
Transport Total IP IPv6
* 1200251 - -
RAW 0 0 0
UDP 1 1 0
TCP 1200006 1200006 0
INET 1200007 1200007 0
FRAG 0 0 0
 
total used free shared buffers cached
Mem: 30074 22371 7703 0 10 259
-/+ buffers/cache: 22100 7973
Swap: 815 0 815

# ss -s; free -m

Total: 1200234 (kernel 1200251)

TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4

Transport Total IP IPv6

* 1200251 - -

RAW 0 0 0

UDP 1 1 0

TCP 1200006 1200006 0

INET 1200007 1200007 0

FRAG 0 0 0

total used free shared buffers cached

Mem: 30074 22371 7703 0 10 259

-/+ buffers/cache: 22100 7973

Swap: 815 0 815

每分鐘給所有的120萬個websocket傳送一條訊息，訊息內容為當前的伺服器的時間。
CPU使用較高，傳送很快，頻寬可以達到46M。群發完一次大約需要8秒左右。

05/22 04:42:57.569 INFO [ool-2-worker-15] c.c.w.s.WebServer - send msg to workers 。for 8454e7d8-b8ca-4881-912b-6cdf3e6787bf
05/22 04:43:05.279 INFO [ool-2-worker-15] c.c.w.s.WebServer - sent msg to workers for 8454e7d8-b8ca-4881-912b-6cdf3e6787bf. current workers: 1200000

1 2	05/22 04:42:57.569 INFO [ool-2-worker-15] c.c.w.s.WebServer - send msg to workers 。for 8454e7d8-b8ca-4881-912b-6cdf3e6787bf 05/22 04:43:05.279 INFO [ool-2-worker-15] c.c.w.s.WebServer - sent msg to workers for 8454e7d8-b8ca-4881-912b-6cdf3e6787bf. current workers: 1200000

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read writ| recv send| in out | int csw
74 9 14 0 0 3| 0 24k|6330k 20M| 0 0 | 20k 1696
70 23 0 0 0 6| 0 64k| 11M 58M| 0 0 | 18k 2526
75 11 6 0 0 7| 0 0 |9362k 66M| 0 0 | 24k 11k
82 4 8 0 0 6| 0 0 | 11M 35M| 0 0 | 24k 10k
85 0 14 0 0 1| 0 0 |8334k 12M| 0 0 | 44k 415
84 0 15 0 0 1| 0 0 |9109k 16M| 0 0 | 36k 425
81 0 19 0 0 0| 0 24k| 919k 858k| 0 0 | 23k 629
76 0 23 0 0 0| 0 0 | 151k 185k| 0 0 | 18k 1075

----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--

usr sys idl wai hiq siq| read writ| recv send| in out | int csw

74 9 14 0 0 3| 0 24k|6330k 20M| 0 0 | 20k 1696

70 23 0 0 0 6| 0 64k| 11M 58M| 0 0 | 18k 2526

75 11 6 0 0 7| 0 0 |9362k 66M| 0 0 | 24k 11k

82 4 8 0 0 6| 0 0 | 11M 35M| 0 0 | 24k 10k

85 0 14 0 0 1| 0 0 |8334k 12M| 0 0 | 44k 415

84 0 15 0 0 1| 0 0 |9109k 16M| 0 0 | 36k 425

81 0 19 0 0 0| 0 24k| 919k 858k| 0 0 | 23k 629

76 0 23 0 0 0| 0 0 | 151k 185k| 0 0 | 18k 1075

客戶端(一共20個，這裡選取其中一個檢視它的指標)。每個客戶端保持6萬個連線。每個訊息從伺服器傳送到客戶端接收到總用時平均1412毫秒，而且標準差較大，每個連線用時差別較大。

Active WebSockets for 6674c9d8-24c6-4e77-9fc0-58afabe7436f
count = 60000
WebSocket Errors for 6674c9d8-24c6-4e77-9fc0-58afabe7436f
count = 0
 
-- Histograms ------------------------------------------------------------------
Message latency for 6674c9d8-24c6-4e77-9fc0-58afabe7436f
count = 454157
min = 716
max = 9297
mean = 1412.77
stddev = 1102.64
median = 991.00
75% 1449.00
95% 4136.00
98% 4951.00
99% 5308.00
99.9% 8854.00
 
-- Meters ----------------------------------------------------------------------
Message Rate for 6674c9d8-24c6-4e77-9fc0-58afabe7436f
count = 454244
mean rate = 18821.51 events/minute
1-minute rate = 67705.18 events/minute
5-minute rate = 49917.79 events/minute
15-minute rate = 24355.57 events/minute

Active WebSockets for 6674c9d8-24c6-4e77-9fc0-58afabe7436f

count = 60000

WebSocket Errors for 6674c9d8-24c6-4e77-9fc0-58afabe7436f

count = 0

-- Histograms ------------------------------------------------------------------

Message latency for 6674c9d8-24c6-4e77-9fc0-58afabe7436f

count = 454157

min = 716

max = 9297

mean = 1412.77

stddev = 1102.64

median = 991.00

75% 1449.00

95% 4136.00

98% 4951.00

99% 5308.00

99.9% 8854.00

-- Meters ----------------------------------------------------------------------

Message Rate for 6674c9d8-24c6-4e77-9fc0-58afabe7436f

count = 454244

mean rate = 18821.51 events/minute

1-minute rate = 67705.18 events/minute

5-minute rate = 49917.79 events/minute

15-minute rate = 24355.57 events/minute

Undertow

建立120萬個連線，不傳送訊息，輕輕鬆鬆達到。記憶體佔用較少，還剩餘11G記憶體。

# ss -s; free -m
Total: 1200234 (kernel 1200240)
TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4
 
Transport Total IP IPv6
* 1200240 - -
RAW 0 0 0
UDP 1 1 0
TCP 1200006 1200006 0
INET 1200007 1200007 0
FRAG 0 0 0
 
total used free shared buffers cached
Mem: 30074 18497 11576 0 10 286
-/+ buffers/cache: 18200 11873
Swap: 815 0 815

# ss -s; free -m

Total: 1200234 (kernel 1200240)

TCP: 1200006 (estab 1200002, closed 0, orphaned 0, synrecv 0, timewait 0/0), ports 4

Transport Total IP IPv6

* 1200240 - -

RAW 0 0 0

UDP 1 1 0

TCP 1200006 1200006 0

INET 1200007 1200007 0

FRAG 0 0 0

total used free shared buffers cached

Mem: 30074 18497 11576 0 10 286

-/+ buffers/cache: 18200 11873

Swap: 815 0 815

每分鐘給所有的120萬個websocket傳送一條訊息，訊息內容為當前的伺服器的時間。
群發玩一次大約需要15秒。

03:19:31.154 [pool-1-thread-1] INFO c.colobu.webtest.undertow.WebServer$ - send msg to channels for d9b450da-2631-42bc-a802-44285f63a62d
03:19:46.755 [pool-1-thread-1] INFO c.colobu.webtest.undertow.WebServer$ - sent 1200000 channels for d9b450da-2631-42bc-a802-44285f63a62d

1 2	03:19:31.154 [pool-1-thread-1] INFO c.colobu.webtest.undertow.WebServer$ - send msg to channels for d9b450da-2631-42bc-a802-44285f63a62d 03:19:46.755 [pool-1-thread-1] INFO c.colobu.webtest.undertow.WebServer$ - sent 1200000 channels for d9b450da-2631-42bc-a802-44285f63a62d

客戶端(一共20個，這裡選取其中一個檢視它的指標)。每個客戶端保持6萬個連線。每個訊息從伺服器傳送到客戶端接收到總用時平均672毫秒，而且標準差較小，每個連線用時差別不大。

Active WebSockets for b2e95e8d-b17a-4cfa-94d5-e70832034d4d
count = 60000
WebSocket Errors for b2e95e8d-b17a-4cfa-94d5-e70832034d4d
count = 0
 
-- Histograms ------------------------------------------------------------------
Message latency for b2e95e8d-b17a-4cfa-94d5-e70832034d4d
count = 460800
min = 667
max = 781
mean = 672.12
stddev = 5.90
median = 671.00
75%
95%
98%
99%
99.9%
 
-- Meters ----------------------------------------------------------------------
Message Rate for b2e95e8d-b17a-4cfa-94d5-e70832034d4d
count = 460813
mean rate = 27065.85 events/minute
1-minute rate = 69271.67 events/minute
5-minute rate = 48641.78 events/minute
15-minute rate = 24128.67 events/minute
Setup Rate for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

Active WebSockets for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

count = 60000

WebSocket Errors for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

count = 0

-- Histograms ------------------------------------------------------------------

Message latency for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

count = 460800

min = 667

max = 781

mean = 672.12

stddev = 5.90

median = 671.00

75%

95%

98%

99%

99.9%

-- Meters ----------------------------------------------------------------------

Message Rate for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

count = 460813

mean rate = 27065.85 events/minute

1-minute rate = 69271.67 events/minute

5-minute rate = 48641.78 events/minute

15-minute rate = 24128.67 events/minute

Setup Rate for b2e95e8d-b17a-4cfa-94d5-e70832034d4d

node.js

node.js不是我要考慮的框架，列在這裡只是作為參考。效能也不錯。

Active WebSockets for 537c7f0d-e58b-4996-b29e-098fe2682dcf
count = 60000
WebSocket Errors for 537c7f0d-e58b-4996-b29e-098fe2682dcf
count = 0
 
-- Histograms ------------------------------------------------------------------
Message latency for 537c7f0d-e58b-4996-b29e-098fe2682dcf
count = 180000
min = 808
max = 847
mean = 812.10
stddev = 1.95
median = 812.00
75% 812.00
95% 813.00
98% 814.00
99% 815.00
99.9% 847.00
 
-- Meters ----------------------------------------------------------------------
Message Rate for 537c7f0d-e58b-4996-b29e-098fe2682dcf
count = 180000
mean rate = 7191.98 events/minute
1-minute rate = 10372.33 events/minute
5-minute rate = 16425.78 events/minute
15-minute rate = 9080.53 events/minute

Active WebSockets for 537c7f0d-e58b-4996-b29e-098fe2682dcf

count = 60000

WebSocket Errors for 537c7f0d-e58b-4996-b29e-098fe2682dcf

count = 0

-- Histograms ------------------------------------------------------------------

Message latency for 537c7f0d-e58b-4996-b29e-098fe2682dcf

count = 180000

min = 808

max = 847

mean = 812.10

stddev = 1.95

median = 812.00

75% 812.00

95% 813.00

98% 814.00

99% 815.00

99.9% 847.00

-- Meters ----------------------------------------------------------------------

Message Rate for 537c7f0d-e58b-4996-b29e-098fe2682dcf

count = 180000

mean rate = 7191.98 events/minute

1-minute rate = 10372.33 events/minute

5-minute rate = 16425.78 events/minute

15-minute rate = 9080.53 events/minute

參考文件

[譯] Go 實現百萬 WebSocket 連線
2019-08-06
GoWeb
Django使用channels實現Websocket連線
2020-12-18
DjangoWeb
[譯] 使用 Node.js 提供百萬的活躍 WebSocket 連線
2019-04-23
Node.jsWeb
用 Golang 實現百萬級 Websocket 服務
2018-08-23
GolangWeb
websocket連線
2024-08-15
Web
SQL中的四種連線方式
2020-04-05
SQL
Golang 連線池的幾種實現案例
2020-02-29
Golang
基於redis實現的四種常見的限流策略
2021-06-17
Redis
四種常見NLP框架使用總結
2019-08-13
框架
使用 WebSocket 客戶端連線 MQTT 伺服器
2018-07-22
Web客戶端MQQT伺服器
盤點用jQuery框架實現“for迴圈”的四種方式！
2021-06-17
jQuery框架
Vue+WebSocket 實現頁面實時重新整理長連線
2019-05-27
VueWeb
php : tp框架swoole實現websocket，wss
2020-12-26
PHP框架Web
WebSocket 是什麼原理？為什麼可以實現持久連線？
2023-11-30
Web
WebSocket斷線重連
2018-09-10
Web
框架-SPI四種模式+通用裝置驅動實現
2020-10-31
框架模式
基於websocket單臺機器支援百萬連線分散式聊天(IM)系統
2019-08-27
Web分散式
快速理解VirtualBox的四種網路連線方式
2018-04-23
連線多種型別的伺服器降低維護和運營成本
2022-03-11
型別伺服器
7種常見且實用的Python框架!
2023-01-12
Python框架
css實現四種常見邊框內外角組合
2018-05-22
CSS
使用雲伺服器，如何實現Rdesktop連線？
2022-02-09
伺服器
golang兩種資料庫連線池實現
2024-11-22
Golang資料庫
Websocket 突破最大長連線
2021-09-09
Web
【譯】WebSocket協議第四章——連線握手(Opening Handshake)
2018-06-21
Web協議
mstsc 和mstsc /admin分別遠端連線伺服器有什麼區別?
2021-05-14
伺服器
前端框架路由實現的Hash和History兩種模式的區別
2019-10-18
前端框架路由模式
批次殺死MySQL連線的四種方法詳解
2021-09-09
MySql
Sqlserver執行計劃中表的四種連線方式
2022-10-14
SQLServer
快速排序的四種python實現
2019-02-17
排序Python
【知識分享】伺服器常見的四種硬碟介紹
2023-01-16
伺服器硬碟
關於 WebSocket 和 HTTP 區別的思考以及一個最簡單的 WebSocket 的客戶端和伺服器實現
2022-11-16
WebHTTP客戶端伺服器
微信小程式實現WebSocket心跳重連
2019-03-03
微信小程式Web
NetCore框架WTM的分表分庫實現
2022-06-09
NetCore框架
VScode遠端連線伺服器連線不上，各種神奇的報錯
2020-11-14
VSCode伺服器
使用MySQL的遞延Join連線實現高效分頁 - Aaron
2022-01-25
MySql
WebSocket 是什麼原理？為什麼可以實現持久連線？有點懵！！！
2020-09-27
Web
websocket連線mina被拒絕
2020-11-01
Web
體驗用yarp連線websocket
2021-11-16
Web

四種框架分別實現百萬websocket常連線的伺服器

伺服器的引數調優

TCP/IP引數配置

最大檔案描述符

應用執行時調優

OutOfMemory Killer

客戶端的引數調優

伺服器測試

Netty伺服器

Spray伺服器

Undertow

node.js

參考文件

相關文章