Python解析xml大檔案(sax)

wklken發表於2015-12-21
使用到的包:xml.sax 文件

程式碼託管位置 github-pytools

需求

讀取xml資料檔案,檔案較大,需要實時處理插入到資料庫

xml文件

處理

sax處理時並不會像dom一樣可以以類似節點的維度進行讀取,它只有 開始標籤 內容 結束標籤 之分

處理思想是:通過一個handler,對開始標籤,內容,結束標籤各有一個處理函式

程式碼及註解

person 處理類

加上入庫的完整程式碼

平時拿python來分析資料,工具指令碼還有hadoop streamming,但是用的面和深度實在欠缺
只能說道行還淺,需要多多實踐

The end!

打賞支援我寫出更多好文章,謝謝!

打賞作者

打賞支援我寫出更多好文章,謝謝!

任選一種支付方式

Python解析xml大檔案(sax) Python解析xml大檔案(sax)

相關文章