在一個應用服務中,對於時效性要求沒那麼高的業務場景,我們沒必要等到所有任務執行完才返回結果,例如使用者註冊場景中,儲存了使用者賬號密碼之後,就可以立即返回,後續的賬號啟用郵件,可以用一種非同步的形式去處理,這種非同步操作可以用佇列服務來實現。否則,如果等到郵件傳送成功可能幾秒過去了。
Celery 是什麼?
Celery 是Python語言實現的分散式佇列服務,除了支援即時任務,還支援定時任務,Celery 有5個核心角色。
Task
任務(Task)就是你要做的事情,例如一個註冊流程裡面有很多工,給使用者發驗證郵件就是一個任務,這種耗時的任務就可以交給Celery去處理,還有一種任務是定時任務,比如每天定時統計網站的註冊人數,這個也可以交給Celery週期性的處理。
Broker
Broker 的中文意思是經紀人,指為市場上買賣雙方提供中介服務的人。在Celery中這個角色相當於資料結構中的佇列,介於生產者和消費者之間經紀人。例如一個Web系統中,生產者是主程式,它生產任務,將任務傳送給 Broker,消費者是 Worker,是專門用於執行任務的後臺服務。Celery本身不提供佇列服務,一般用Redis或者RabbitMQ來實現佇列服務。
Worker
Worker 就是那個一直在後臺執行任務的人,也成為任務的消費者,它會實時地監控佇列中有沒有任務,如果有就立即取出來執行。
Beat
Beat 是一個定時任務排程器,它會根據配置定時將任務傳送給 Broker,等待 Worker 來消費。
Backend
Backend 用於儲存任務的執行結果,每個任務都有返回值,比如傳送郵件的服務會告訴我們有沒有傳送成功,這個結果就是存在Backend中,當然我們並不總是要關心任務的執行結果。
記住這5個角色後面理解Celery就輕鬆了。
快速入門
接觸任何新東西,沒有什麼比實際動手學得更快了。假設我們選擇Redis作為broker,你需要安裝redis並且已經啟動了redis服務(這個步驟請自行借用搜尋引擎解決)
pip install -U "celery[redis]"
複製程式碼
1、建立Celery例項
# tasks.py
from celery import Celery
app = Celery('tasks', broker='redis://localhost:6379/0')
複製程式碼
2、建立任務
假設這個傳送郵件的任務需要5秒鐘才能執行完
# tasks.py
@app.task
def send_mail(email):
print("send mail to ", email)
import time
time.sleep(5)
return "success"
複製程式碼
在沒有Celery的情況下,程式順序執行,每個步驟都需要等上一步執行完成。
1. 插入記錄到資料庫
2. 發郵件
3. 註冊成功
複製程式碼
我們可以把2放在一個任務中交給celery去執行,這樣我們就不需要等待發郵件完成,你只需要安排celery去處理幫我去完成就好了。程式碼就變成了
1. 插入記錄到資料庫
2. celery 幫我去發郵件
3. 註冊成功
複製程式碼
第二步是非常快的,它只需要把任務放進佇列裡面去,並不會等任務真正執行完。這跟生活是完全貼切的,例如我們很多事情都不是自己親歷其為去做,而是將一個不太重要或即時性沒那麼高的事情轉交給別人處理。
3、啟動Worker
啟動Worker,監聽 Broker 中是否有任務,命令:celery worker
,你可能需要指定引數
celery -A tasks worker --loglevel=info
複製程式碼
-A: 指定 celery 例項所在哪個模組中,例子中,celery例項在tasks.py檔案中,啟動成功後,能看到資訊
函式用app.task 裝飾器修飾之後,就會成為Celery中的一個Task。
4、呼叫任務
在主程式中呼叫任務,掉任務傳送給 Broker, 而不是真正執行該任務
# user.py
from tasks import send_mail
def register():
import time
start = time.time()
print("1. 插入記錄到資料庫")
print("2. celery 幫我發郵件")
send_mail.delay("xx@gmail.com")
print("3. 告訴使用者註冊成功")
print("耗時:%s 秒 " % (time.time() - start))
if __name__ == '__main__':
register()
複製程式碼
在主程式中,呼叫函式的.delay
方法
目錄結構:
── celery_test
├── tasks.py
└── user.py
複製程式碼
執行 python user.py, 啟動應用程式
1. 插入記錄到資料庫
2. celery 幫我發郵件
3. 告訴使用者註冊成功
耗時:0.22688984870910645 秒
複製程式碼
程式花了不到0.23秒就執行完成,如果按照正常的同步邏輯去執行,至少需要5秒鐘,因為發郵件的任務就花了5秒。
在worker服務視窗看日誌資訊
注意:
1、celery worker 啟動時,如果是root使用者,需要設定環境變數:
$ export C_FORCE_ROOT='true'
複製程式碼
2、 Celery4.x 開始不再支援Windows平臺,如果需要在Windows開發,請使用3.x的版本。
3、使用 RabbitMQ 或 Redis 作為 Broker,生產環境永遠不要使用關聯式資料庫
4、不要使用複雜物件作為任務函式的引數
# Good
@app.task
def my_task(user_id):
user = User.objects.get(id=user_id)
print(user.name)
# ...
複製程式碼
# Bad
@app.task
def my_task(user):
print(user.name)
# ...
複製程式碼
小結
學習Celery,首先需要知道它的應用場景,然後是Celery中的常見角色,最後按照步驟感受一下Celery是如何跑起來的。
參考連結:
同步發表部落格:foofish.net