用Python理解Web併發模型

發表於2016-06-24

Java程式設計師進階三條必經之路：資料庫、虛擬機器、非同步通訊。

前言

雖然非同步是我們急需掌握的高階技術，但是不積跬步無以至千里，同步技術的學習是不能省略的。今天這篇文章主要用Python來介紹Web併發模型，直觀地展現同步技術的缺陷以及非同步好在哪裡。

最簡單的併發

import socket

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()
server.bind(('0.0.0.0', 9527))
server.listen(1024)

while True:
    client, clientaddr = server.accept()  # blocking
    request = client.recv(1024)  # blocking
    client.send(response)  # maybe blocking
    client.close()

import socket

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()

server.bind(('0.0.0.0', 9527))

server.listen(1024)

while True:

client, clientaddr = server.accept() # blocking

request = client.recv(1024) # blocking

client.send(response) # maybe blocking

client.close()

上面這個例子太簡單了，訪問localhost:9527，返回“Hello World”。用ab來測試效能，資料如下：

ab -n 100000 -c 8 http://localhost:9527/
Time taken for tests:   1.568 seconds

1 2	ab -n 100000 -c 8 http://localhost:9527/ Time taken for tests: 1.568 seconds

傳送10萬個請求，8（我的CPU核數為8）個請求同時併發，耗時1.568秒。
效能瓶頸在哪裡呢？就在上面的兩個半阻塞。
accept和recv是完全阻塞的，而為什麼send是半個阻塞呢？
在核心的 socket實現中，會有兩個快取 (buffer)。read buffer 和 write buffer 。當核心接收到網路卡傳來的客戶端資料後，把資料複製到 read buffer ，這個時候 recv阻塞的程式就可以被喚醒。
當呼叫 send的時候，核心只是把 send的資料複製到 write buffer 裡，然後立即返回。只有 write buffer 的空間不夠時 send才會被阻塞，需要等待網路卡傳送資料騰空 write buffer 。在 write buffer的空間足夠放下 send的資料時程式才可以被喚醒。
如果一個請求處理地很慢，其他請求只能排隊，那麼併發量肯定會受到影響。

多程式

每個請求對應一個程式倒是能解決上面的問題，但是程式太佔資源，每個請求的資源都是獨立的，無法共享，而且程式的上下文切換成本也很高。

import socket
import signal
import multiprocessing 

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()
server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
server.bind(('0.0.0.0', 9527))
server.listen(1024)

def handler(client):
    request = client.recv(1024)
    client.send(response)
    client.close()

#多程式裡的子程式執行完後並不會死掉，而是變成殭屍程式，等待主程式掛掉後才會死掉，下面這條語句可以解決這個問題。
signal.signal(signal.SIGCHLD,signal.SIG_IGN)

while True:
    client, addr = server.accept()
    process = multiprocessing.Process(target=handler, args=(client,))
    process.start()

import socket

import signal

import multiprocessing

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()

server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

server.bind(('0.0.0.0', 9527))

server.listen(1024)

def handler(client):

request = client.recv(1024)

client.send(response)

client.close()

#多程式裡的子程式執行完後並不會死掉，而是變成殭屍程式，等待主程式掛掉後才會死掉，下面這條語句可以解決這個問題。

signal.signal(signal.SIGCHLD,signal.SIG_IGN)

while True:

client, addr = server.accept()

process = multiprocessing.Process(target=handler, args=(client,))

process.start()

Prefork

這是多程式的改良版，預先分配好和CPU核數一樣的程式數，可以控制資源佔用，高效處理請求。

import socket
import multiprocessing

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()
server.bind(('0.0.0.0', 9527))
server.listen(1024)

def handler():
    while True:
        client, addr = server.accept()
        request = client.recv(1024)
        client.send(response)
        client.close()
processors = 8
for i in range(0, processors):
    process = multiprocessing.Process(target=handler, args=())
    process.start()

import socket

import multiprocessing

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()

server.bind(('0.0.0.0', 9527))

server.listen(1024)

def handler():

while True:

client, addr = server.accept()

request = client.recv(1024)

client.send(response)

client.close()

processors = 8

for i in range(0, processors):

process = multiprocessing.Process(target=handler, args=())

process.start()

耗時：1.640秒。

執行緒池

import Queue
import socket
import threading

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()
server.bind(('0.0.0.0', 9527))
server.listen(1024)

def handler(queue):
    while True:
        client  = queue.get()
        request = client.recv(1024)
        client.send(response)
        client.close()

queue = Queue.Queue()
processors = 8
for i in range(0, processors):
    thread = threading.Thread(target=handler, args=(queue,))
    thread.daemon = True
    thread.start()

while True:
    client, clientaddr = server.accept()
    queue.put(client)

import Queue

import socket

import threading

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket()

server.bind(('0.0.0.0', 9527))

server.listen(1024)

def handler(queue):

while True:

client = queue.get()

request = client.recv(1024)

client.send(response)

client.close()

queue = Queue.Queue()

processors = 8

for i in range(0, processors):

thread = threading.Thread(target=handler, args=(queue,))

thread.daemon = True

thread.start()

while True:

client, clientaddr = server.accept()

queue.put(client)

耗時：3.901秒，大部分時間花在佇列上，執行緒佔用資源比程式少（資源可以共享），但是要考慮執行緒安全問題和鎖的效能，而且python有臭名昭著的GIL，導致不能有效利用多核CPU。

epoll

import select
import socket

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server.setblocking(False)
server_address = ('localhost', 9527)
server.bind(server_address)
server.listen(1024)
READ_ONLY = select.EPOLLIN | select.EPOLLPRI
epoll = select.epoll()
epoll.register(server, READ_ONLY)
timeout = 60
fd_to_socket = { server.fileno(): server}
while True:
    events = epoll.poll(timeout)
    for fd, flag in events:
        sock = fd_to_socket[fd]
        if flag & READ_ONLY:
            if sock is server:
                conn, client_address = sock.accept()
                conn.setblocking(False)
                fd_to_socket[conn.fileno()] = conn
                epoll.register(conn, READ_ONLY)
            else:
                request = sock.recv(1024)
                sock.send(response)
                sock.close()
                del fd_to_socket[fd]

import select

import socket

response = 'HTTP/1.1 200 OK\r\nConnection: Close\r\nContent-Length: 11\r\n\r\nHello World'

server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

server.setblocking(False)

server_address = ('localhost', 9527)

server.bind(server_address)

server.listen(1024)

READ_ONLY = select.EPOLLIN | select.EPOLLPRI

epoll = select.epoll()

epoll.register(server, READ_ONLY)

timeout = 60

fd_to_socket = { server.fileno(): server}

while True:

events = epoll.poll(timeout)

for fd, flag in events:

sock = fd_to_socket[fd]

if flag & READ_ONLY:

if sock is server:

conn, client_address = sock.accept()

conn.setblocking(False)

fd_to_socket[conn.fileno()] = conn

epoll.register(conn, READ_ONLY)

else:

request = sock.recv(1024)

sock.send(response)

sock.close()

del fd_to_socket[fd]

最後祭出epoll大神，三大非同步通訊框架Netty、NodeJS、Tornado共同採用的通訊技術，耗時1.582秒，但是要注意是單程式單執行緒哦。epoll真正發揮作用是在長連線應用裡，單執行緒處理上萬個長連線玩一樣，佔用資源極少。

如何理解Python web開發技術
2018-03-28
PythonWeb
併發-1-併發模型
2018-10-17
模型
【python高併發】程序、執行緒的理解
2024-06-25
Python執行緒
Web | 淺談用Python進行Web開發
2019-09-01
WebPython
PHP下用Swoole實現Actor併發模型
2019-06-04
PHP模型
Java併發指南2：深入理解Java記憶體模型JMM
2019-11-08
Java記憶體模型
python+selenium grid 併發執行測試用例，不能併發
2020-09-01
Python
併發模型比較
2018-09-19
模型
Python web伺服器3: 靜態伺服器&併發web伺服器
2018-12-08
PythonWeb伺服器
快速理解併發、並行
2019-04-21
並行
學習 Go併發模型
2021-08-06
Go模型
面向Web應用的併發壓力測試工具——Locust實用攻略
2021-12-07
Web
《Flask Web開發基於Python的Web應用開發實戰》簡評
2019-09-15
FlaskWebPython
併發程式設計---JMM模型
2020-09-29
程式設計模型
Python Web開發
2018-12-27
PythonWeb
python如何支援併發？
2020-07-25
Python
深入理解併發程式設計藝術之計算機記憶體模型
2023-10-30
程式設計計算機記憶體模型
【GoLang 那點事】深入淺出那些你知道但不理解的併發模型
2019-08-19
Golang模型
深入理解併發和並行
2024-04-13
並行
Web開發初探（系統理解Web知識點）
2020-09-14
Web
併發程式設計模型小結
2018-09-27
程式設計模型
聊聊 ab 和 jmeter 的併發模型
2021-11-29
JMeter模型
單機高併發模型設計
2022-07-09
模型
go 併發程式設計案例二常見併發模型介紹
2018-09-20
Go程式設計模型
【Java併發程式設計】從CPU快取模型到JMM來理解volatile關鍵字
2020-09-21
Java程式設計快取模型
Python的web開發
2018-08-21
PythonWeb
Web前端---用抽象的思維理解JavaScript
2019-10-11
Web前端抽象JavaScript
Python的併發、並行
2018-05-06
Python並行
Python併發程式設計
2024-08-07
Python程式設計
Python 如果做到高併發？
2023-02-10
Python
學python可以做Web開發嗎？python適合Web開發嗎？
2022-03-04
PythonWeb
《Flask Web開發:基於Python的Web應用開發實戰》學習筆記(二)
2018-03-06
FlaskWebPython筆記
Python全棧Web（Django框架、模型中的CRUD）
2018-10-21
Python全棧WebDjango框架模型
Golang面向併發的記憶體模型
2019-04-02
Golang記憶體模型
併發程式設計——IO模型詳解
2020-08-10
程式設計模型
Golang協程併發的流水線模型
2020-11-18
Golang模型
Java併發中的記憶體模型
2019-05-12
Java記憶體模型
Python 如何開發高效漂亮的輕量級 Web 應用？
2021-09-11
PythonWeb
python閉包 - 理解與應用
2024-04-26
Python

用Python理解Web併發模型

前言

最簡單的併發

多程式

Prefork

執行緒池

epoll

相關文章