使用 Python ElementTree 生成 xml

劍西樓發表於2017-05-11

Python 處理 xml 文件的方法有很多,除了經典的 sax 和 dom 之外,還有一個 ElementTree。

首先 import 之:

1
from xml.etree import ElementTree as etree

然後開始構建 xml 樹:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
from xml.etree.ElementTree import Element, SubElement, ElementTree
 
# 生成根節點
root = Element('root')
# 生成第一個子節點 head
head = SubElement(root, 'head')
# head 節點的子節點
title = SubElement(head, 'title')
title.text = 'Well Dola!'
# 生成 root 的第二個子節點 body
body = SubElement(root, 'body')
# body 的內容
body.text = 'I love Dola!'
tree = ElementTree(root)

這樣就得到了一個 xml 樹的物件 tree 以及它的根節點的物件 root

接著我們把它們變成 xml 串,有兩個辦法,一個是用 tree 物件的 write 方法將 xml 內容寫成一個檔案,還有一個是用 etree 的 tostring 方法轉成 xml 字串:

1
2
3
4
5
# 第一種
tree.write('result.xml', encoding='utf-8')
# 第二種
xml_string = etree.tostring(root)
# xml_string 就是 xml 字串了

但是第二種有一個問題,就是它沒有

1
<?xml version="1.0"?>

這個頭部定義內容:

1
'<root><head><title>Well Dola!</title></head><body>I love Dola!</body></root>'

怎麼辦呢?

有一個辦法是使用 minidom 來實現,方法如下:

1
2
3
4
5
from xml.dom import minidom
# 使用 minidom 解析
tree = minidom.parseString(xml_string)
# 重新生成 xml 字串
xml_string = tree.toxml()

雖然讓計算機多執行了一些程式碼,但是這樣可以把問題解決掉。

最後生成的 xml 程式碼如下:

1
u'<?xml version="1.0" ?><root><head><title>Well Dola!</title></head><body>I love Dola!</body></root>'

當然還可以使用 minidom 中 tree 物件的 toprettyxml 方法把 xml 打得漂亮一點。

相關文章