XML Schema描述了 XML 文件的結構。XML Schema語言也稱為 XML Schema Definition(XSD)。
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
XML Schema的目的是定義 XML 文件的合法構建塊
- 可以出現在文件中的元素和屬性
- 子元素的數量(和順序)
- 元素和屬性的資料型別
- 元素和屬性的預設和固定值
為什麼要學習 XML Schema
在 XML 世界中,每天都在使用數百種標準化的 XML 格式。其中許多 XML 標準是由 XML Schema 定義的。XML Schema 是 DTD 的基於 XML 的(更強大的)替代品。
XML Schema支援資料型別
XML Schema的最大優勢之一是對資料型別的支援。
- 更容易描述文件內容的合法性
- 更容易驗證資料的正確性
- 更容易定義資料約束(對資料的限制)
- 更容易定義資料模式(資料格式)
- 更容易在不同資料型別之間轉換資料
XML Schema使用 XML 語法
XML Schema的另一個強大之處在於它們是用 XML 編寫的。
- 無需學習新語言
- 可以使用 XML DOM 操縱模式
- 可以使用 XSLT 轉換模式
XML Schema是可擴充套件的,因為它們是用 XML 編寫的。使用可擴充套件的模式定義,您可以:
- 在其他模式中重用模式
- 從標準型別派生自己的資料型別
- 在同一文件中引用多個模式
XML Schema保障資料通訊
從傳送方傳送資料到接收方時,必須確保兩者對內容有相同的“期望”。使用 XML Schema,傳送方可以以接收方能理解的方式描述資料。
例如,日期“03-11-2004”在某些國家可能被解釋為11月3日,在其他國家可能被解釋為3月11日。然而,具有這樣資料型別的 XML 元素:
<date type="date">2004-03-11</date>
確保了對內容的相互理解,因為 XML 資料型別“date”要求使用“YYYY-MM-DD”格式。
僅僅是格式正確是不夠的
格式良好的 XML 文件是符合 XML 語法規則的文件,例如:
- 必須以 XML 宣告開頭
- 必須有一個唯一的根元素
- 開始標籤必須有匹配的結束標籤
- 元素區分大小寫
- 所有元素必須關閉
- 所有元素必須正確巢狀
- 所有屬性值必須用引號括起來
- 特殊字元必須使用實體
即使文件格式良好,它們仍然可能包含錯誤,而這些錯誤可能會產生嚴重的後果。考慮以下情況:您訂購了5大毛的鐳射印表機,而不是5臺鐳射印表機。使用 XML Schema,大多數這類錯誤可以被驗證軟體捕捉到。
XSD如何使用
XML 文件可以引用 DTD 或 XML Schema。
簡單的 XML 文件
考慮這個簡單的 XML 文件,名為"note.xml":
<?xml version="1.0"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
下面的例子是一個名為"note.dtd"的 DTD 檔案,定義了上面 XML 文件("note.xml")的元素:
<!ELEMENT note (to, from, heading, body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
XML Schema
下面的例子是一個名為"note.xsd"的 XML Schema 檔案,定義了上面 XML 文件("note.xml") 的元素:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
note 元素是一個複雜型別,因為它包含其他元素。其他元素(to, from, heading, body)是簡單型別,因為它們不包含其他元素。
對 DTD 的引用
這個 XML 文件引用了一個 DTD:
<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
對 XML Schema 的引用
XSD - <schema>
元素
<schema>
元素是每個 XML Schema 的根元素。
<schema>
元素
<schema>
元素是每個 XML Schema 的根元素:
指示 XML 例項文件中使用的任何在此模式中宣告的元素必須是名稱空間限定的。
在 XML 文件中引用模式
這個 XML 文件引用了一個 XML Schema:
<?xml version="1.0"?>
<note xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="note.xsd">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
指定了預設名稱空間宣告。該宣告告訴模式驗證器
一旦有了 XML Schema Instance 名稱空間:
您就可以使用 schemaLocation
屬性。此屬性有兩個值,用空格分隔。第一個值是要使用的名稱空間。第二個值是要用於該名稱空間的 XML 模式的位置:
XSD 簡單元素
XML 模式定義了 XML 檔案中的元素。
簡單元素是僅包含文字的 XML 元素。它不能包含任何其他元素或屬性。
什麼是簡單元素
簡單元素是僅包含文字的 XML 元素。它不能包含任何其他元素或屬性。
然而,“僅文字”限制相當具有誤導性。文字可以是許多不同型別之一。它可以是 XML 模式定義中包含的型別之一(布林值、字串、日期等),或者它可以是您自己定義的自定義型別。
您還可以向資料型別新增限制(facet)以限制其內容,或者您可以要求資料匹配特定模式
定義簡單元素的語法為
<xs:element name="xxx" type="yyy"/>
其中 xxx 是元素的名稱,yyy 是元素的資料型別。
XML 模式具有許多內建資料型別。最常見的型別包括:
xs:string
xs:decimal
xs:integer
xs:boolean
xs:date
示例
以下是一些 XML 元素
<lastname>Refsnes</lastname>
<age>36</age>
<dateborn>1970-03-27</dateborn>
以下是相應的簡單元素定義:
<xs:element name="lastname" type="xs:string"/>
<xs:element name="age" type="xs:integer"/>
<xs:element name="dateborn" type="xs:date"/>
簡單元素的預設值和固定值
簡單元素可以具有指定的預設值或固定值。
當未指定其他值時,預設值會自動分配給元素
在以下示例中,預設值為 "red":
<xs:element name="color" type="xs:string" default="red"/>
固定值也會自動分配給元素,並且您無法指定其他值。
在以下示例中,固定值為 "red":
<xs:element name="color" type="xs:string" fixed="red"/>
XSD 屬性
所有屬性都宣告為簡單型別
簡單元素不能具有屬性。如果一個元素具有屬性,則被視為複雜型別。但是屬性本身始終被宣告為簡單型別。
如何定義屬性
定義屬性的語法為
<xs:attribute name="xxx" type="yyy"/>
其中 xxx
是屬性的名稱,yyy
指定了屬性的資料型別。
XML 模式具有許多內建資料型別。最常見的型別包括:
xs:string
xs:decimal
xs:integer
xs:boolean
xs:date
xs:time
示例, 以下是具有屬性的 XML 元素
<lastname lang="EN">Smith</lastname>
以下是相應的屬性定義
<xs:attribute name="lang" type="xs:string"/>
屬性的預設值和固定值
屬性可以具有指定的預設值或固定值。
當未指定其他值時,預設值會自動分配給屬性。
在以下示例中,預設值為 "EN":
<xs:attribute name="lang" type="xs:string" default="EN"/>
固定值也會自動分配給屬性,並且您無法指定其他值。
在以下示例中,固定值為 "EN":
<xs:attribute name="lang" type="xs:string" fixed="EN"/>
可選和必需的屬性
屬性預設為可選。要指定屬性為必需的,請使用 "use" 屬性:
<xs:attribute name="lang" type="xs:string" use="required"/>
對內容的限制
當 XML 元素或屬性具有定義的資料型別時,它會對元素或屬性的內容施加限制。
如果 XML 元素的型別為 "xs:date",幷包含類似 "Hello World" 的字串,則該元素將無法驗證。
使用 XML 模式,您還可以向 XML 元素和屬性新增自定義限制。這些限制稱為 facets。您可以在下一章中瞭解更多關於 facets 的資訊。
XSD 限制/約束
限制用於定義 XML 元素或屬性的可接受值。對 XML 元素的限制稱為 facets。
對值的限制
以下示例定義了一個名為 "age" 的元素,並施加了限制。age 的值不能小於 0 或大於 120:
<xs:element name="age">
<xs:simpleType>
<xs:restriction base="xs:integer">
<xs:minInclusive value="0"/>
<xs:maxInclusive value="120"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
對一組值的限制要將 XML 元素的內容限制為一組可接受的值,我們將使用列舉約束
以下示例定義了一個名為 "car" 的元素,並施加了限制。唯一可接受的值是:Audi、Golf、BMW
<xs:element name="car">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:enumeration value="Audi"/>
<xs:enumeration value="Golf"/>
<xs:enumeration value="BMW"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
上述示例也可以這樣寫:
<xs:element name="car" type="carType"/>
<xs:simpleType name="carType">
<xs:restriction base="xs:string">
<xs:enumeration value="Audi"/>
<xs:enumeration value="Golf"/>
<xs:enumeration value="BMW"/>
</xs:restriction>
</xs:simpleType>
注意:在這種情況下,型別 "carType" 可以被其他元素使用,因為它不是 "car" 元素的一部分。
對一系列值的限制
要將 XML 元素的內容限制為定義的一系列數字或字母,我們將使用模式約束。
以下示例定義了一個名為 "letter" 的元素,並施加了限制。唯一可接受的值是小寫字母 a 到 z 中的任意一個:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "initials" 的元素,並施加了限制。唯一可接受的值是小寫或大寫字母 a 到 z 中的三個:
<xs:element name="initials">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[A-Z][A-Z][A-Z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例也定義了一個名為 "initials" 的元素,並施加了限制。唯一可接受的值是小寫或大寫字母 a 到 z 中的三個:
<xs:element name="initials">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-zA-Z][a-zA-Z][a-zA-Z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "choice" 的元素,並施加了限制。唯一可接受的值是以下字母中的一個:x、y 或 z:
<xs:element name="choice">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[xyz]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "prodid" 的元素,並施加了限制。唯一可接受的值是一個連續的五位數字,每個數字必須在 0 到 9 的範圍內:
<xs:element name="prodid">
<xs:simpleType>
<xs:restriction base="xs:integer">
<xs:pattern value="[0-9][0-9][0-9][0-9][0-9]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
以下示例定義了一個名為 "letter" 的元素,並施加了限制。可接受的值是小寫字母 a 到 z 的零個或多個例項:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="([a-z])*"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例也定義了一個名為 "letter" 的元素,並施加了限制。可接受的值是一個或多個成對的字母,每個成對由一個小寫字母后跟一個大寫字母組成。例如,"sToP" 將透過此模式驗證,但 "Stop"、"STOP" 或 "stop" 不會:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="([a-z][A-Z])+"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "gender" 的元素,並施加了限制。唯一可接受的值是 male 或 female:
<xs:element name="gender">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="male|female"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
以下示例定義了一個名為 "password" 的元素,並施加了限制。必須連續存在八個字元,這些字元必須是小寫或大寫字母 a 到 z 中的一個,或者數字 0 到 9:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-zA-Z0-9]{8}"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
要指定如何處理空白字元,我們將使用 whiteSpace 約束。
以下示例定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設定為 "preserve",這意味著 XML 處理器不會移除任何空白字元:
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="preserve"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例也定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設定為 "replace",這意味著 XML 處理器將替換所有空白字元(換行符、製表符、空格和回車)為空格:
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="replace"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例也定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設定為 "collapse",這意味著 XML 處理器將移除所有空白字元(換行符、製表符、空格和回車被替換為空格,前導和尾隨空格被移除,多個空格被減少為單個空格):
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="collapse"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
長度限制
要限制元素中值的長度,我們將使用 length、maxLength 和 minLength 約束。
以下示例定義了一個名為 "password" 的元素,並施加了限制。值必須正好為八個字元:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:length value="8"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例定義了另一個名為 "password" 的元素,並施加了限制。值必須至少五個字元,最多八個字元:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:minLength value="5"/>
<xs:maxLength value="8"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
資料型別的限制
約束 描述
enumeration 定義可接受值列表
fractionDigits 指定允許的最大小數位數。必須大於或等於零
length 指定允許的精確字元數或列表項數。必須大於或等於零
maxExclusive 指定數值的上界(值必須小於此值)
maxInclusive 指定數值的上限(值必須小於或等於此值)
maxLength 指定允許的最大字元數或列表項數。必須大於或等於零
minExclusive 指定數值的下界(值必須大於此值)
minInclusive 指定數值的下限(值必須大於或等於此值)
minLength 指定允許的最小字元數或列表項數。必須大於或等於零
pattern 定義可接受的確切字元序列
totalDigits 指定允許的精確數字數。必須大於零
whiteSpace 指定如何處理空白字元(換行符、製表符、空格和回車)
最後
為了方便其他裝置和平臺的小夥伴觀看往期文章:
微信公眾號搜尋:Let us Coding
,關注後即可獲取最新文章推送
看完如果覺得有幫助,歡迎點贊、收藏、關注