1月30號進行修改,本文原本寫著轉載,到後來發現本文存在一些邏輯錯誤,又再參考了另外幾篇文章,重新更新了一下文章,文末會附幾篇參考文章的地址,有興趣的讀者可以點進去看。
django啟動
我們在啟動一個django專案的時候,無論你是在命令列執行還是在pycharm直接點選執行,其實都是執行'runserver'的操作,而ruserver是使用django自帶的的web server,主要用於開發和除錯中,而在正式的環境中,一般會使用nginx+uwsgi模式。
無論是哪種方式,當啟動一個專案,都會做2件事:
- 建立一個WSGIServer類的例項,接受使用者的請求。
- 當一個使用者的http請求到達的時,為使用者指定一個WSGIHandler,用於處理使用者請求與響應,這個Handler是處理整個request的核心。
WSGI
WSGI:全稱是Web Server Gateway Interface,WSGI不是伺服器,也不用於與程式互動的API,更不是程式碼,而只是定義了一個介面,用於描述web server如何與web application通訊的規範。 當客戶端傳送一次請求後,最先處理請求的實際上是 web 伺服器就是我們經常說的 nginx、Apache 這類的 web 伺服器,然後web伺服器再把請求交給web應用程式(如django)處理,這中間的中介就是WSGI,它把 web 伺服器和 web 框架 (Django) 連線起來。
簡單介紹一下WSGI的一些內容,它規定應用是可呼叫物件(函式/方法),然後它接受2個固定引數:一個是含有伺服器端的環境變數,另一個是可呼叫物件,這個物件用來初始化響應,給響應加上status code狀態碼和httpt頭部,並且返回一個可呼叫物件。可以看個簡單的例子# 這段程式碼來自python核心程式設計
def simplr_wsgi_app(environ, start_response):
# 固定兩個引數,django中也使用同樣的變數名
status = '200 OK'
headers = [{'Content-type': 'text/plain'}]
# 初始化響應, 必須在返回前呼叫
start_response(status, headers)
# 返回可迭代物件
return ['hello world!']
複製程式碼
django中,實現同樣邏輯的是通過WSGIHandler這個類,下面我們也會重點介紹它! 如果對WSGI與uWSGI有興趣的,推薦大家看這篇文章,WSGI & uwsgi ,大讚!
中介軟體基本概念
顧名思義,中介軟體是位於Web伺服器端和Web應用之間的,它可以新增額外的功能。當我們建立一個django專案(通過pycharm),它會自動幫我們設定一些必要的中介軟體。
MIDDLEWARE_CLASSES = [
'django.middleware.security.SecurityMiddleware',
'django.contrib.sessions.middleware.SessionMiddleware',
'django.middleware.common.CommonMiddleware',
'django.middleware.csrf.CsrfViewMiddleware',
'django.contrib.auth.middleware.AuthenticationMiddleware',
'django.contrib.auth.middleware.SessionAuthenticationMiddleware',
'django.contrib.messages.middleware.MessageMiddleware',
'django.middleware.clickjacking.XFrameOptionsMiddleware',
]
複製程式碼
中介軟體要麼對來自使用者的資料進行預處理,然後傳送給應用;要麼在應用將響應負載返回給使用者之前,對結果資料進行一些最終的調整。通俗一點,在django中,中間能夠幫我們準備好request這個物件,然後應用可以直接使用request物件獲取到各類資料,也幫我們將response新增頭部,狀態碼等。
資料流
當django接受到一個請求時,會初始化一個WSGIHandler,可以在專案下的wsgi.py檔案進行跟蹤,你就會發現這一個類。
class WSGIHandler(base.BaseHandler):
def __call__(self, environ, start_response):
pass
複製程式碼
這個類遵循WSGI應用的規定,它接受2個引數:一個是含有伺服器端的環境變數,另一個是可呼叫物件,返回一個可迭代物件。 這個handler控制了從請求到響應的整個過程,主要流程:
在網上看到另外一張圖,更為完整:
大致幾個步驟:
1. 使用者通過瀏覽器請求一個頁面
2. 請求到達Request Middlewares,中介軟體對request做一些預處理或者直接response請求
3. URLConf通過urls.py檔案和請求的URL找到相應的View
4. View Middlewares被訪問,它同樣可以對request做一些處理或者直接返回response
5. 呼叫View中的函式
6. View中的方法可以選擇性的通過Models訪問底層的資料
7. 所有的Model-to-DB的互動都是通過manager完成的
8. 如果需要,Views可以使用一個特殊的Context
9. Context被傳給Template用來生成頁面
a.Template使用Filters和Tags去渲染輸出
b.輸出被返回到View
c.HTTPResponse被髮送到Response Middlewares
d.任何Response Middlewares都可以豐富response或者返回一個完全不同的response
e.Response返回到瀏覽器,呈現給使用者
複製程式碼
中間類中的順序與方法
django 的中介軟體類至少含有以下四個方法中的一個:
process_request、 process_view、process_exception、process_response
WSGIHandler通過load_middleware將這個些方法分別新增到_request_middleware、_view_middleware、_response_middleware 和 _exception_middleware四個列表中。
並不是每個中介軟體都有這4個方法,如果不存在某個方法,那麼在載入的過程中,這個類就被跳過。
for middleware_path in settings.MIDDLEWARE_CLASSES:
···
if hasattr(mw_instance, 'process_request'):
request_middleware.append(mw_instance.process_request)
if hasattr(mw_instance, 'process_view'):
self._view_middleware.append(mw_instance.process_view)
if hasattr(mw_instance, 'process_template_response'):
self._template_response_middleware.insert(0, mw_instance.process_template_response)
if hasattr(mw_instance, 'process_response'):
self._response_middleware.insert(0, mw_instance.process_response)
if hasattr(mw_instance, 'process_exception'):
self._exception_middleware.insert(0, mw_instance.process_exception)
複製程式碼
我們可以從原始碼看出,process request 和 process response的執行載入順序正好是相反,在迴圈中,process_request是被append到列表的末尾,而process_request是被insert到最前面的。
(可能有些情況Comment中介軟體在Session前面,瞭解載入的順序就好了)process_request
舉幾個中介軟體的例子
class CommonMiddleware(object):
# 虛擬碼
def process_request(self, request):
# Check for denied User-Agents
if 'HTTP_USER_AGENT' in request.META:
for user_agent_regex in settings.DISALLOWED_USER_AGENTS:
if user_agent_regex.search(request.META['HTTP_USER_AGENT']):
raise PermissionDenied('Forbidden user agent')
host = request.get_host()
if settings.PREPEND_WWW and host and not host.startswith('www.'):
host = 'www.' + host
pass
複製程式碼
CommonMiddleware的process_request主要是判斷使用者代理是否符合要求以及在完善URL,如增加www或者末尾加/。
class SessionMiddleware(object):
def process_request(self, request):
session_key = request.COOKIES.get(settings.SESSION_COOKIE_NAME)
request.session = self.SessionStore(session_key)
複製程式碼
SessionMiddleware的process_request是把session_key從cookies中取出來然後放到request.session中。
class AuthenticationMiddleware(MiddlewareMixin):
def process_request(self, request):
assert hasattr(request, 'session'), (
"The Django authentication middleware requires session middleware "
"to be installed. Edit your MIDDLEWARE%s setting to insert "
"'django.contrib.sessions.middleware.SessionMiddleware' before "
"'django.contrib.auth.middleware.AuthenticationMiddleware'."
) % ("_CLASSES" if settings.MIDDLEWARE is None else "")
request.user = SimpleLazyObject(lambda: get_user(request))
複製程式碼
在前面提過,中介軟體的載入是按照一定順序(正反序), AuthenticationMiddleware的process_request方法基於session中介軟體被載入過了,然後通過request的session,將使用者取出來放入到request.user 。
process_request 應該返回 None 或者 HTTPResponse 物件。當返回 None 時,WSGI handler 會繼續載入 process_request 裡面的方法,如果是後一種情況,那麼Handlers會直接載入_response_middleware的列表,然後直接response。
解析 url
當_request_middleware列表中的 process_request 被遍歷完,會得到一個經過處理的request物件(加入了request.session,request.user等屬性)。
django將按順序進行對url進行正則匹配,如果匹配不成功,就會丟擲異常。如果request的中介軟體返回None,那麼Django會去解析使用者請求的URL。
在setting中有一個ROOT_URLCONF,它指向urls.py檔案,根據這個檔案可以生產一個urlconf,本質上,他就是url與檢視函式之間的對映表,然後通過resolver解析使用者的url,找到第一個匹配的view。
process_view
經過url的匹配,會獲得檢視函式以及相關引數。在呼叫view函式之前,django會先載入_view_middleware中的各個process_view方法。
逐個預設的中介軟體看了一遍,只看到csrf有這個方法
# 虛擬碼
class CsrfViewMiddleware(object):
def process_view(self, request, callback, callback_args, callback_kwargs):
if getattr(request, 'csrf_processing_done', False):
return None
try:
csrf_token = _sanitize_token(
request.COOKIES[settings.CSRF_COOKIE_NAME])
# Use same token next time
request.META['CSRF_COOKIE'] = csrf_token
except KeyError:
csrf_token = None
if getattr(callback, 'csrf_exempt', False):
return None
pass
複製程式碼
這個方法的作用是判斷cookiers中是否存在csrf的欄位,如果不存在,會直接丟擲異常,如果存在,返回None。 view中介軟體和requst中介軟體一樣,必須返回None或一個httpResponse,如果返回一個httpresponse,那麼Handlers會直接載入_response_middleware的列表,然後返回HttpResponse,那麼Handlers會直接載入_response_middleware的列表,然後直接response
執行view邏輯
view函式需要滿足:
- 基於函式(FBV)或者基於類的(CVB)的檢視。
- 接受的引數第一個必須為request,並且需要返回一個response物件。
如果檢視函式丟擲一個異常,Handler 將會迴圈遍歷_exception_middleware 列表,如果有一個異常被丟擲,後面的 process_exception 將不會被執行。
process_response
在這個階段,我們得到了一個 HTTPResponse 物件,這個物件可能是 process_view 返回的,也可能是檢視函式返回的。現在我們將迴圈訪問響應中介軟體。這是中介軟體調整資料的最後的機會。舉個例子:
class XFrameOptionsMiddleware(object):
def process_response(self, request, response):
# Don't set it if it's already in the response
if response.get('X-Frame-Options') is not None:
return response
# Don't set it if they used @xframe_options_exempt
if getattr(response, 'xframe_options_exempt', False):
return response
response['X-Frame-Options'] = self.get_xframe_options_value(request,
response)
return response
複製程式碼
XFrameOptionsMiddleware將X-Frame-Options加入到response當中,防止網站被巢狀、被劫持。
class CsrfViewMiddleware(object):
def process_response(self, request, response):
if getattr(response, 'csrf_processing_done', False):
return response
if not request.META.get("CSRF_COOKIE_USED", False):
return response
# Set the CSRF cookie even if it's already set, so we renew
# the expiry timer.
response.set_cookie(settings.CSRF_COOKIE_NAME,
request.META["CSRF_COOKIE"],
max_age=settings.CSRF_COOKIE_AGE,
domain=settings.CSRF_COOKIE_DOMAIN,
path=settings.CSRF_COOKIE_PATH,
secure=settings.CSRF_COOKIE_SECURE,
httponly=settings.CSRF_COOKIE_HTTPONLY
)
# Content varies with the CSRF cookie, so set the Vary header.
patch_vary_headers(response, ('Cookie',))
response.csrf_processing_done = True
return response
複製程式碼
CsrfViewMiddleware在response中設定csrf cookies
最後
當response的中介軟體載入完,系統在返回之前會呼叫WSGI伺服器端傳過來的start_response方法物件,初始化響應,然後進行response響應。
總結
本文重點在於:
- django啟動時,啟動了一個WSGIserver以及為每個請求的使用者生成一個handler。
- 理解WSGI協議,並且WSGIHandler這個類控制整個請求到響應的流程,以及整個流程的基本過程。
- 中介軟體的概念,以及每一個process_request, process_response, process_view, process_exception方法在哪個步驟發揮著什麼樣的作用。
- 中間價的執行時有順序的,request與view是按照順序去執行的,而response和exception是反序的,這一步實在WSGIHandler在載入到它的各個列表的時候完成的。
參考部落格:
1,Django教程筆記:六、中介軟體middleware
2,做python Web開發你要理解:WSGI & uwsgi
3,從請求到響應 django 都做了哪些處理
4,django從請求到返回都經歷了什麼