python 解析xml 檔案: DOM 方式

微微微笑發表於2015-12-31

原文網址 : https://www.cnblogs.com/miniren/p/5092019.html

環境

python：3.4.4

準備xml檔案

首先新建一個xml檔案，countries.xml。內容是在python官網上看到的。

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank>1</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank>4</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank>68</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

準備python檔案

新建一個test_DOM.py，用來解析xml檔案。

#!/usr/bin/python
# -*- coding: UTF-8 -*-

from xml.dom.minidom import parse
import xml.dom.minidom

DOMTree = xml.dom.minidom.parse("countries.xml")
collection = DOMTree.documentElement
if collection.hasAttribute("data"):
    print ("Root element : %s" % collection.getAttribute("data"))

countries = collection.getElementsByTagName("country")

for country in countries:
    print ("*****Country*****")
    if country.hasAttribute("name"):
        print ("Name: %s" % country.getAttribute("name"))
    rank = country.getElementsByTagName('rank')[0]
    print ("Rank: %s" % rank.childNodes[0].data)
    year = country.getElementsByTagName('year')[0]
    print ("Year: %s" % year.childNodes[0].data)
    gdppc = country.getElementsByTagName('gdppc')[0]
    print ("Gdppc: %s" % gdppc.childNodes[0].data)
    neighbors = country.getElementsByTagName('neighbor')
    for neighbor in neighbors:
        print ("Neighbor:", neighbor.getAttribute("name"),neighbor.getAttribute("direction"))

執行結果

>python test_DOM.py
*****Country*****
Name: Liechtenstein
Rank: 1
Year: 2008
Gdppc: 141100
Neighbor: Austria E
Neighbor: Switzerland W
*****Country*****
Name: Singapore
Rank: 4
Year: 2011
Gdppc: 59900
Neighbor: Malaysia N
*****Country*****
Name: Panama
Rank: 68
Year: 2011
Gdppc: 13600
Neighbor: Costa Rica W
Neighbor: Colombia E

備註

DOM（Document Object Model）

DOM是一個W3C的跨語言的API，用來讀取和更改 XML 文件。

一個DOM解析器在解析一個XML文件時，一次性讀取整個文件，把文件中的所有元素儲存在記憶體中的一個樹結構中，之後可以對這個樹結構進行讀取或修改，也可以把修改過的樹結構寫入xml檔案。

參見： https://docs.python.org/2/library/xml.dom.html

DOMTree = xml.dom.minidom.parse("countries.xml")

使用 xml.dom.minidom解析器開啟 countries.xml 檔案，並返回一個 Document物件，也就是樹結構。Document 物件代表了整個 XML 文件，包括它的元素、屬性、處理指令、備註等。

參見： https://docs.python.org/2/library/xml.dom.minidom.html

Return a Document from the given input. filename_or_file may be either a file name, or a file-like object. parser, if given, must be a SAX2 parser object. This function will change the document handler of the parser and activate namespace support; other parser configuration (like setting an entity resolver) must have been done in advance.

collection = DOMTree.documentElement

返回 DOMTree的根元素。

Document.documentElement
The one and only root element of the document.

rank = country.getElementsByTagName('rank')[0]

從country往下尋找所有 tag名為“rank”的元素節點，將找到的第一個節點賦值給 rank。

Document.getElementsByTagName(tagName)
Search for all descendants (direct children, children’s children, etc.) with a particular element type name.

collection.getAttribute("data")

獲取並返回 collection 的“data”屬性值。如果collection沒有“data”屬性，則返回一個空的字串。

Element.getAttribute(name)
Return the value of the attribute named by name as a string. If no such attribute exists, an empty string is returned, as if the attribute had no value.

XML 檔案解析實踐 (DOM 解析)
2020-10-02
XML
python XML 檔案解析
2024-04-24
PythonXML
基於 DOM 的 XML 檔案解析類
2020-09-30
XML
Python XML解析之DOM
2018-09-29
PythonXML
Python解析XML檔案生成HTML
2019-02-16
PythonXMLHTML
jdom解析xml檔案
2020-11-09
XML
使用 Java 解析XML檔案
2022-04-07
JavaXML
XML DOM 解析器概述
2022-02-26
XML
使用jaxp解析器dom方式對xml節點進行操作
2018-03-25
XML
XML DOM 解析器錯誤概述
2022-06-05
XML
springMVC---配置檔案解析（web.xml）
2018-12-08
SpringMVCWebXML
c#(解析xml檔案基礎方法)
2020-10-02
C#XML
如何使用 ABAP 程式碼解析 XML 檔案
2022-09-04
XML
mybatis原始碼配置檔案解析之五：解析mappers標籤（解析XML對映檔案）
2020-06-29
MyBatis原始碼APPXML
XML解析-最快的方式SAX
2018-05-02
XML
python之XML解析
2019-09-23
PythonXML
java的XML解析(DOM4J技術)
2019-01-10
JavaXML
xml檔案
2020-09-28
XML
mybatis的全域性配置檔案SqlMapConfig.xml解析
2019-02-27
MyBatisSQLXML
DOM4J 解析 XML 之忽略轉義字元
2019-02-16
XML字元
使用JAXP對xml文件進行DOM解析基礎
2021-09-09
XML
Python改寫maven的pom.xml檔案
2018-04-29
PythonMavenXML
Android與Python之批量修改AndroidManifest.xml檔案
2018-05-03
AndroidPythonXML
python實現修改xml檔案內容詳解
2022-08-13
PythonXML
ie中jQuery無法解析xml檔案的解決方案
2021-09-09
jQueryXML
AndroidMainfest.xml檔案
2018-08-22
AndroidAIXML
xml是什麼格式的檔案 xml檔案怎麼開啟
2022-02-24
XML
java 語音用xml檔案實現圖形介面 xml檔案
2021-10-08
JavaXML
XML DOM（Document Object Model）
2018-05-08
XMLObject
解析XML檔案時,無效的XML 字元 (Unicode: 0x7)異常處理
2018-08-06
XML字元Unicode
Android學習筆記之AndroidManifest.xml檔案解析(詳解)
2018-11-13
Android筆記XML
死磕Spring之IoC篇 - 解析自定義標籤（XML 檔案）
2021-02-25
SpringXML
死磕Spring之IoC篇 - BeanDefinition 的解析階段（XML 檔案）
2021-02-24
SpringBeanXML
Go xml檔案處理
2022-03-15
GoXML
【超好用API推薦】用dom4j建立XML檔案並寫入節點
2021-08-27
APIXML
把list集合的內容寫入到Xml中，通過XmlDocument方式寫入Xml檔案中
2018-12-03
XML
XML DOM Parse Error 物件概述
2022-06-05
XMLError物件
PHP透過DOM操作XML
2021-09-09
PHPXML
XML DOM 新增節點概述
2022-04-22
XML