用Java結合SAX 2.0 解析XML文件 (轉)

worldblog發表於2008-01-25
用Java結合SAX 2.0 解析XML文件 (轉)[@more@]

/*
自從真正形成以來(我認為是Org.組織釋出XML標準時開始),XML得到了很快的發展,
 很多廠商都有推出了自己的XML解析器,如的xalan,IBM的xerces,sun的J等,不過這些都是在
 基於JAXP( for XML processing)的,從 1.4.0開始的後續j2sdk裡都附加了JAXP,這給開發人員
 帶來了很大的方便,這使得我們在處理一般的XML功能上的問題時不再需要去用第三方的XML了.
 隨著XML的迅速發展,SAX也從1.0到了現在的2.0了(還是能夠和1.0相容),結構上有了一些較大的變化.

 DOM(document model)每次讀取XML節點時都要把它load到裡來,在文件很大時,就顯得很慢了,SAX(simple API for XML),是一個XML解析器的介面,它比DOM更低階一些,它是一種基於事件和回撥的XML處理方式, 因此在解析速度上DOM是沒法比的(當要解析的XML文件很大的時更是如此).那麼在SAX中事件響應(event)是什麼呢 ? 我個人認為這一點和,AWT中的事件義有點相似的,都有是指在觸發某些特定的行為時所做的處理,如:mouse 的click事件等到. 這裡則是指碰到特定的XML節點的所做的處理,如文件開始(startDocument),文件結束(endDocument),元素開始(startElement)等很多,大家看一下SAX的API中的方法名字就知道有哪些事件了,基本上可以做到見文知義的.在只想分析XML內容(只讀),要求高,靈活性 能夠定位錯誤資訊(SAX能夠定位錯誤的行列位置)時,最好用SAX來做. 一般情況下SAX是按下面的原理去使用的:
  <1>設定事件處理器(SAX 1.0是使用一個透過繼承HandlerBase類的例項來設定的,SAX 2.0則是繼承DefaultHandler的,還有用XMLReader方式的,在原理上沒有很大的區別)
  <2>載入要解析的內容
  <3>在需要解析的事件方法裡(具體參見SAX API文件)加入自己的控制邏輯.
  <4>重複<3>直到解析完為止. 
 
 在這裡我自己寫了一個描述電影海報資訊的XML(file.xml),用SAX2.0寫了一個很簡單的XML內容閱讀器來解析它, 和大家交流一下自己的心得.在我的機器上經過了測試的(OS: Advanced Server(English version),
  pentium , 256M RAM)
*/

import org.w3c.dom.*;
import org.xml.sax.*;
import org.xml.sax.helpers.*;
import javax.xml.parsers.*;

class MyXMLReader extends DefaultHandler

 //Fields
 private int index;
 private Locator locator;

 //Constructor
 public MyXMLReader(){
 super(); //it must be done !
 }

 //nain method
 public static void main(String[] args){
 try{ 
  SAXParserFactory   = SAXParserFactory.newInstance();
  SAXParser sp = sf.newSAXParser();
  MyXMLReader reader = new MyXMLReader();
  sp.parse(new Input("film.xml"),reader);
 }
 catch(Exception e){
 e.printStackTrace();
 }
 } 

 //Response the startDocument event
 public void startDocument() {
 System.out.println("n********************************* (: 元旦電影海報 :) ***********************************n");
 } 

//Response the startElement event
 public void startElement(String uri, String localName, String qName, Attributes attrs){ 
 if( qName.equalsIgnoreCase("film") ){ 
 index ++; 
 int attrCount = attrs.getLength();
 for( int i = 0; i < attrCount; i ++ ){
 String attrName = attrs.getQName(i);
 if( attrName.equalsIgnoreCase("name") ){
 System.out.println("t第" + index + "場,片名:<>");
 }
 if( attrName.equalsIgnoreCase("price") ){
 System.out.println("t票價:" + attrs.getValue(i) ); 
 }
 if( attrName.equalsIgnoreCase("station") ){
 System.out.println("t放映地點:" + attrs.getValue(i) ); 
 }
 if( attrName.equalsIgnoreCase("time") ){
 System.out.println("t放映時間:" + attrs.getValue(i) );
 }
 if( attrName.equalsIgnoreCase("describtion") ){
 System.out.println("t影片簡介:" + attrs.getValue(i) );
 }
 System.out.println();
 }
 }

 //Response the endDocument event
 public void endDocument(){
 System.out.println("ttttttt------ 共有" + index + "場電影要放映"); 
 }

 //Response the endElement event
 public void endElement(String uri, String localName, String qName){
   //add your codes if neccessary ...
 }

 //Print the a error information
 public void fatalError(SAXParseException e){
 System.out.println("nFatal error information --&gt");
 System.out.println("t" + e.getMessage());
 System.out.println("tAt line " + locator.getLineNumber() +
  ",column " + locator.getColumnNumber());
 }
 
 //Print the usual error information
 public void error(SAXParseException e){
 System.out.println("nUsual error information --&gt"); 
 System.out.println("t" + e.getMessage());
 System.out.println("tAt line " + locator.getLineNumber() +
  ",column " + locator.getColumnNumber());
 }
 
 //Print the warning information
 public void warning(SAXParseException e){
 System.out.println("nWarning information --&gt"); 
 System.out.println("t" + e.getMessage()); 
 System.out.println("tAt line " + locator.getLineNumber() +
  ",column " + locator.getColumnNumber());
 }

 //Store the error locator object
 public void setDocumentLocator(Locator lct){
 locator = lct;
 }

}//End class MyXMLReader

附: film.xml完全的內容:


  <!-- 年元月1號長沙市各大影院落放映列表 --&gt
 
    describtion="國產最新大片,張藝謀導演,梁朝偉,張曼玉,李連杰等眾多大明星主演">
 

   describtion="韓國大片">
 

   describtion="韓國大片,有點像英雄">
 
 
   describtion="反映對越自衛反擊戰時期中國軍人的故事片">
   

   describtion="反映對越自衛反擊戰時期中國軍人的故事片">
 
 
    describtion="反映對越自衛反擊戰時期中國軍人的故事片">
 

   describtion="反映對越自衛反擊戰時期中國軍人的故事片">
 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-998442/,如需轉載,請註明出處,否則將追究法律責任。

相關文章