Django模型驗證器詳解和原始碼分析

大江東流發表於2020-09-07

原文網址 : https://www.cnblogs.com/django-dev/p/13628121.html

轉發請註明來源

在Django的模型欄位引數中，有一個引數叫做validators，這個引數是用來指定當前欄位需要使用的驗證器，也就是對欄位資料的合法性進行驗證，比如大小、型別等。

Django的驗證器可以分為模型相關的驗證器和表單相關的驗證器，它們基本類似，但在使用上有區別。

本文討論的是模型相關的驗證器。

一、自定義驗證器

一個驗證器其實就是一個可呼叫的物件（函式或類），接收一個初始輸入值作為引數，對這個值進行一系列邏輯判斷，如果不滿足某些規則或者條件，則表示驗證不通過，丟擲一個ValidationError異常。如果滿足條件則通過驗證，不返回任何內容（也就是預設的return None），可以繼續下一步。

驗證器具有重要作用，可以被重用在別的欄位上，是工具型別的邏輯封裝。

下面是一個驗證器的例子，它只允許偶數通過驗證：

from django.core.exceptions import ValidationError
from django.utils.translation import gettext_lazy as _

def validate_even(value):
    if value % 2 != 0:
        raise ValidationError(
            _('%(value)s is not an even number'),
            params={'value': value},
        )

通過下面的方式，將偶數驗證器應用在欄位上：

from django.db import models

class MyModel(models.Model):
    even_field = models.IntegerField(validators=[validate_even])

因為驗證器執行之前，（輸入的）資料會被轉換為 Python 物件，因此我們可以將同樣的驗證器用在 Django form 表單中（事實上Django為表單提供了另外一些驗證器）：

from django import forms

class MyForm(forms.Form):
    even_field = forms.IntegerField(validators=[validate_even])

你還可以通過Python的魔法方法__cal__()編寫更復雜的可配置的驗證器，比如Django內建的RegexValidator驗證器就是這麼幹的。

驗證器也可以是一個類，但這時候就比較複雜了，需要確保它可以被遷移框架序列化，確保編寫了deconstruction()和__eq__()方法。這種做法很難找到參考文獻和博文，要靠自己摸索或者研究DJango原始碼。

二、工作機制

讓我們來測試一下上面寫的驗證器：

>>> from .models import MyModel
>>> a = MyModel.objects.create(even_field=3)
>>> a
<MyModel: MyModel object (1)>
>>> a.even_field
3

什麼？！！！不是說只有偶數才能通過驗證嗎？這裡我提供了數字3，可是為什麼建立成功了？？

我們接著在admin站點中註冊MyModel模型，然後在圖形化介面後臺中建立MyModel的例項，你會發現這個時候驗證器起作用了，奇數是無法通過表單驗證的！

為什麼會這樣？？

這就要從Django的原始碼說起！

Django是這麼設計的：

模型的驗證器不會在呼叫save()方法的時候自動執行
表單的驗證器會在呼叫save()方法的時候自動執行

為什麼這麼設計？個人猜測，Django官方為了序列化、鏈式呼叫等功能的相容性，沒有自動進行驗證操作。

這個設計在原始碼中是怎麼體現的？

Django的模型相關原始碼中，沒有is_valid()方法，也不會自動呼叫full_clean() 方法，所以Django不會自動進行模型驗證。但是它依然提供了四個重要的驗證方法，也就是full_clean() 、clean_fields() 、clean() 和validate_unique()，一會細說
Django的表單系統forms的相關原始碼中，表單在save之前會自動執行一個is_valid()方法，這個方法裡會呼叫驗證器。

表單的內容在其它章節中講解。

下面介紹Django模型的驗證步驟和四個方法：

模型驗證的步驟：

如果你手動呼叫了full_clean()方法，那麼會依次自動呼叫下面的三個方法
clean_fields()：驗證各個欄位的合法性
clean()：驗證模型級別的合法性
validate_unique()：驗證欄位的獨一無二性

本質上，後面三個方法是具體實現，full_clean()是領頭羊，實際操作中，你完全可以具體使用其中一個或多個。用了full_clean()就等於後面三個都用。

full_clean()

簽名：Model.full_clean(exclude=None, validate_unique=True)

exclude用於指定某些欄位不進行驗證，也就是所謂的例外欄位
validate_unique用於指定是否呼叫validate_unique()方法

讓我們看下它的原始碼：

    def full_clean(self, exclude=None, validate_unique=True):

        errors = {}
        if exclude is None:
            exclude = []
        else:
            exclude = list(exclude)

        try:
            self.clean_fields(exclude=exclude)    #1
        except ValidationError as e:
            errors = e.update_error_dict(errors)

        try:
            self.clean()    #2
        except ValidationError as e:
            errors = e.update_error_dict(errors)

        if validate_unique:
            for name in errors:
                if name != NON_FIELD_ERRORS and name not in exclude:
                    exclude.append(name)
            try:
                self.validate_unique(exclude=exclude)   #3
            except ValidationError as e:
                errors = e.update_error_dict(errors)

        if errors:
            raise ValidationError(errors)

可以看出，它依次呼叫了其它三個方法，如果最後的errors中有內容，則丟擲ValidationError異常。

我們最好不要去修改full_clean()方法的原始碼，一般也不用重寫它，直接呼叫即可。

模型的save()方法不會自動呼叫full_clean()方法，你必須手動呼叫。

如果呼叫驗證器後，丟擲ValidationError異常，Django會將所有的異常資訊放置在e.message_dict字典中供使用。比如下面的例子：

# 在檢視中我們可以這麼做
from django.core.exceptions import ValidationError
try:
    article.full_clean()
except ValidationError as e:
    # 在這裡做一些異常處理操作
    pass

在模型定義中我們可以如下重寫save()方法，實現自動驗證功能，不需要在檢視中反覆呼叫了：

# models.py
from django.core.exceptions import ValidationError
from django.utils.translation import gettext_lazy as _

def validate_even(value):
    if value % 2 != 0:
        raise ValidationError(
            _('%(value)s is not an even number'),
            params={'value': value},
        )
       
from django.db import models

class MyModel(models.Model):
    even_field = models.IntegerField(validators=[validate_even])

    def save(self, *args, **kwargs):   # 重寫save方法是關鍵
        try:
            self.full_clean()   
            super().save(*args, **kwargs)
        except ValidationError as e:
            print('模型驗證沒通過： %s' % e.message_dict)

執行過程展示：

>>> from .models import MyModel
>>> a = MyModel.objects.create(even_field=5)
模型驗證沒通過：  {'even_field': ['5 is not an even number']}

這樣，我們就實現了自動的模型驗證。

小技巧：可以通過列印e來檢視，Django怎麼封裝的錯誤資訊，給我們提供了哪些鍵值，比如上例中，我們可以使用e.message_dict['even_field']。

clean_fields()

簽名：Model.clean_fields(exclude=None)

引數同上，看下它的原始碼：

    def clean_fields(self, exclude=None):

        if exclude is None:
            exclude = []

        errors = {}
        for f in self._meta.fields:
            if f.name in exclude:
                continue

            raw_value = getattr(self, f.attname)
            if f.blank and raw_value in f.empty_values:
                continue
            try:
                setattr(self, f.attname, f.clean(raw_value, self))  #核心是這一句
            except ValidationError as e:
                errors[f.name] = e.error_list

        if errors:
            raise ValidationError(errors)

我們最好也不要去修改和重寫它的原始碼。

這個方法本質上就是迴圈模型中的所有欄位，找出其中定義了驗證器的那些，並執行它們。

我們前面自定義的偶數驗證器，其實就是在這裡被呼叫的。

clean()

這個方法很特別，我們看看它的原始碼：

    def clean(self):
        """
        Hook for doing any extra model-wide validation after clean() has been
        called on every field by self.clean_fields. Any ValidationError raised
        by this method will not be associated with a particular field; it will
        have a special-case association with the field defined by NON_FIELD_ERRORS.
        """
        pass

什麼都沒有！實際上，這個方法是給你留了個鉤子，你需要重寫它，然後在裡面編寫模型級別的驗證，比如修改模型的屬性，以及跨欄位相關的驗證邏輯。

下面我們通過一個例子來展示它的用法：

import datetime
from django.core.exceptions import ValidationError
from django.db import models
from django.utils.translation import gettext_lazy as _

class Article(models.Model):
    content = models.TextField()
    status = models.CharField(max_length=32)
    pub_date = models.DateField(blank=True, null=True)

    def clean(self):
        # 不允許草稿文章具有釋出日期欄位
        if self.status == '草稿' and self.pub_date is not None:
            raise ValidationError(_('草稿文章尚未釋出，不應該有釋出日期！'))
        # 如果已釋出的文章還沒有設定釋出日期，則將釋出日期設定為當天
        if self.status == '已釋出' and self.pub_date is None:
            self.pub_date = datetime.date.today()

# 更多Django技術文章請訪問https://www.liujiangblog.com

說明：

gettext_lazy在這裡無關緊要
在Article模型中重寫了clean方法，它不需要接受其它引數
第一個if判斷，不允許草稿文章具有釋出日期欄位。如果你提供了，對不起，丟擲ValidationError異常
第二個if判斷，如果已釋出的文章還沒有設定釋出日期，則將釋出日期設定為當天
這是一個跨欄位的，全域性性的驗證方法，它不像我們一開始自定義的驗證器那樣，不是作為一個驗證器引數進行提供，而是寫在clean方法中了，一定要注意區別。

clean()方法寫好了，我們就可以在Article模型中重寫save()方法了：

    def save(self, *args, **kwargs):

        from django.core.exceptions import NON_FIELD_ERRORS

        try:
            self.full_clean()
            super().save(*args, **kwargs)
        except ValidationError as e:
            print('驗證沒通過： %s' % e.message_dict[NON_FIELD_ERRORS])

注意：這裡我們匯入了NON_FIELD_ERRORS，在最後列印了e.message_dict[NON_FIELD_ERRORS]，這是為什麼呢？

因為，clean()中編寫的都是模型級別、跨欄位的驗證方法，沒有具體和某個欄位繫結，所以Django提供了一個NON_FIELD_ERRORS關鍵字，用來說明這不是某個欄位引起的異常，而是非欄位相關的錯誤。

如果你非要將錯誤定位到某個具體的欄位，也不是不可以的，如下例子所示：

class Article(models.Model):
    ...
    def clean(self):
        if self.status == '草稿' and self.pub_date is not None:
            raise ValidationError({'pub_date': _('草稿文章尚未釋出，不應該有釋出日期！')})
        ...

甚至，你可以如下方式，對映欄位和錯誤資訊：

raise ValidationError({
    'title': ValidationError(_('Missing title.'), code='required'),
    'pub_date': ValidationError(_('Invalid date.'), code='invalid'),
})

這些技巧，本質上就是給ValidationError異常類提供資訊引數。

validate_unique()

簽名：Model.validate_unique(exclude=None)

它的原始碼也很簡單：

    def validate_unique(self, exclude=None):

        unique_checks, date_checks = self._get_unique_checks(exclude=exclude)

        errors = self._perform_unique_checks(unique_checks)
        date_errors = self._perform_date_checks(date_checks)

        for k, v in date_errors.items():
            errors.setdefault(k, []).extend(v)

        if errors:
            raise ValidationError(errors)

這個方法類似clean_fields()，只不過它只用來驗證模型中的唯一性約束是否滿足，而不是欄位的值是否滿足驗證需求。

如果你提供了exclude引數，那麼該引數包含的所有欄位都不會進行唯一性驗證。

我們最好也不要去修改和重寫它的原始碼。

總結

Django中模型驗證器的使用套路：

編寫欄位級別的驗證器，在欄位中作為引數指定
或者編寫clean()方法，實現模型級別、跨欄位的驗證功能
重寫save()方法，呼叫full_clean()，實現全自動的驗證
或者在檢視中，通過模型例項呼叫full_clean()方法，實現手動驗證

三、內建驗證器

驗證器的作用很重要，需求也很廣泛，Django為此內建了一些驗證器，我們直接拿來使用即可：

RegexValidator

這是正則匹配驗證器。用於對輸入的值進行正則搜尋，如果命中，則平安無事，如果沒命中則彈出 ValidationError 異常。

數字簽名：class RegexValidator(regex=None, message=None, code=None, inverse_match=None, flags=0)

引數說明：

regex：用於匹配的正規表示式
message：自定義異常錯誤資訊。預設是"Enter a valid value"
code：自定義錯誤碼。預設是"invalid"
inverse_match：將通過和不通過驗證的判斷邏輯反轉。也就是未命中則平安，命中則出錯。
flags：編譯正規表示式時使用的正則flags。預設為0。

EmailValidator

數字簽名：class EmailValidator(message=None, code=None, whitelist=None)

郵件格式驗證器。

引數說明：

message: 自定義錯誤資訊，預設為 "Enter a valid email address"。
code：自定義錯誤碼，預設為"invalid"。
whitelist：郵件域名白名單，預設為['localhost']。

URLValidator

數字簽名：class URLValidator(schemes=None, regex=None, message=None, code=None)

RegexValidator的子類，用於驗證url的格式是否正確。

schemes：指定URL/URI的協議模式，預設值為['http', 'https', 'ftp', 'ftps']

validate_email

EmailValidator的一個例項，未做任何自定義。

validate_slug

一個確保輸入值是字母、數字、下劃線和連字元組合的RegexValidator的例項。

validate_unicode_slug

上面的Unicode編碼版本

validate_ipv4_address

一個RegexValidator的例項，用於判斷輸入值是否為ipv4格式

validate_ipv6_address

上面的ipv6版本

validate_ipv46_address

同時支援ipv4和ipv6

validate_comma_separated_integer_list

判斷輸入是否是一個以逗號分隔的數字列表，一個RegexValidator的例項。

int_list_validator

數字簽名：int_list_validator(sep=', ', message=None, code='invalid', allow_negative=False)

判斷一個由數字組成的字串是否以指定的sep分隔。allow_negative用於反轉判斷邏輯。

MaxValueValidator

簽名：class MaxValueValidator(limit_value, message=None)

是否超過指定最大值

MinValueValidator

簽名：class MinValueValidator(limit_value, message=None)

是否小於指定的最小值

MaxLengthValidator

簽名：class MaxLengthValidator(limit_value, message=None)

輸入值的長度是否超過限定值

MinLengthValidator

輸入值的長度是否小於限定值

DecimalValidator

簽名：lass DecimalValidator(max_digits, decimal_places)

數字驗證器。當發生下面情況時彈出異常：

輸入值超過max_digits
輸入值的位數超過decimal_places
輸入值大於最大位數與小數位數之差。（待確認）

FileExtensionValidator

簽名：class FileExtensionValidator(allowed_extensions, message, code)

副檔名不在合法性列表中。合法性列表通過引數allowed_extensions指定。

validate_image_file_extension

通過pillow庫確定一個圖片檔案的副檔名是合法的

ProhibitNullCharactersValidator

簽名：class ProhibitNullCharactersValidator(message=None, code=None)

對輸入值進行 str(value) 操作，轉換成字串，然後如果這個字串中包含1個以上的空字元'\x00'，則驗證失敗。

更多技術文章請訪問: https://www.liujiangblog.com

更多視訊教程請訪問: https://www.liujiangblog.com/video/

Linuxepoll模型詳解及原始碼分析
2018-06-03
Linux模型原始碼
django 驗證碼框架
2019-01-13
Django框架
django-rest-framework原始碼分析2—認證(Authentication)原始碼解析
2020-12-15
DjangoRESTFramework原始碼
Netty原始碼分析之Reactor執行緒模型詳解
2021-11-22
Netty原始碼React執行緒模型
Django實現驗證碼
2018-06-13
Django
LinkedList詳解-原始碼分析
2020-05-21
原始碼
ArrayList詳解-原始碼分析
2020-05-20
原始碼
JavaScript數字和字母組合驗證碼詳解
2018-11-27
JavaScript
drf 認證校驗及原始碼分析
2020-10-31
原始碼
Tomcat詳解系列(3) - 原始碼分析準備和分析入口
2021-04-02
Tomcat原始碼
Django之圖形驗證碼
2024-03-28
Django
SpringSecurity認證流程原始碼詳解
2019-01-10
SpringGse原始碼
ArrayMap詳解及原始碼分析
2019-02-27
原始碼
LeakCanary詳解與原始碼分析
2018-12-14
原始碼
EventBus詳解及原始碼分析
2019-04-28
原始碼
MapReduce 詳解與原始碼分析
2022-09-21
原始碼
Django（59）驗證和授權
2021-06-11
Django
Django（55）GenericAPIView原始碼分析
2021-06-09
DjangoAPIView原始碼
Django（64）頻率認證原始碼分析與自定義頻率認證
2021-06-16
Django原始碼
Django REST framework API 指南（12）：驗證器
2018-03-15
DjangoRESTFrameworkAPI
django-rest-framework-原始碼解析004-三大驗證(認證/許可權/限流)
2020-07-23
DjangoRESTFramework原始碼
給Django Admin新增驗證碼和多次登入嘗試限制
2020-07-25
Django
【驗證碼逆向專欄】某多多驗證碼逆向分析
2024-11-29
影片直播app原始碼，傳送驗證碼驗證碼識別
2023-10-11
APP原始碼
JavaScript驗證碼生成和驗證效果
2018-05-21
JavaScript
[Abp vNext 原始碼分析] - 7. 許可權與驗證
2019-08-07
原始碼
微服務生態元件之Spring Cloud OpenFeign詳解和原始碼分析
2022-05-06
微服務元件SpringCloud原始碼
微服務生態元件之Spring Cloud LoadBalancer詳解和原始碼分析
2022-05-09
微服務元件SpringCloud原始碼
五種I/O模型和Java NIO原始碼分析
2019-01-07
模型Java原始碼
Mapreduce Job提交流程原始碼和切片原始碼詳解
2020-10-13
原始碼
java動態代理——代理方法的假設和驗證及Proxy原始碼分析五
2020-08-05
Java原始碼
Django（49）drf解析模組原始碼分析
2021-06-08
Django原始碼
Django（51）drf渲染模組原始碼分析
2021-06-08
Django原始碼
Django（44）drf序列化原始碼分析
2021-06-04
Django原始碼
詳解驗證碼與打碼平臺的攻防對抗
2022-09-27
Netty原始碼分析之自定義編解碼器
2020-06-23
Netty原始碼
【驗證碼逆向專欄】某驗“初代”滑塊驗證碼逆向分析
2023-02-03
Ohcount：原始碼行計數器和分析器
2018-06-11
原始碼