基於PHP與XML的PDF文件生成技術(摘要) (轉)

worldblog發表於2007-12-12
基於PHP與XML的PDF文件生成技術(摘要) (轉)[@more@]

全文見:?id=85">

摘要:namespace prefix = o ns = "urn:schemas--com::office" />

本論文簡要介紹了、XML、PDF等技術的原理以及它們的應用情況。力圖運用PHP面向的特性,構建出一套基於PHP和XML的線上PDF文件生成。文中詳細探討了整個系統的組成部分以及各自的實現過程。並在最後給出一個運用這套系統實現的動態建立報表的例項。

Abstract

This article introduced the fundamentls of PHP,XML and PDF and their application situation at present,expecting to build a PHP&XML-based dynamic PDF documents creating system through the PHP’s OO features. Furthermore,we discussed in detail on the components of the whole system and their respective realizing methods. Finally,we represented an example of creating reports dynamically using this system.

 

關鍵詞

PHP   XML  T   DTD   PDF 

 

 

1.  引言

   在資訊科技飛速發展的時代,無論政府、企業還是個人,他們對如何透過資訊科技提高自身工作,節省開支具有濃厚的興趣。他們急切要找到一種優秀的技術,可以把傳統上以紙張為媒介的、報表、票單據、手冊、申請書等等等等轉化為一種可以非常方便的在網際網路以及內部自動生成、傳播、、瀏覽、列印的電子文件。而如今最為熱門的“無紙化辦公”、“電子商務”等等都將以此為基礎。

 

  這種文件格式就Adobe公司的PDF(可移植文件格式),它已是全世界電子版文件分發的公開實用標準 。  任何只要Acrobat reader 5.0 的,便可以自由瀏覽、下載、列印PDF文件。PDF無疑具有其它電子文件格式不可比擬的優越性。

   

我們知道B/S系統作為當前以及將來最流行的一種架構,可以很好的實現各種基於瀏覽器的應用,而PHP作為一種優秀的Web語言,特別適合開發用於處理表單輸入,查詢等針對瀏覽器使用者的前端應用程式。由於PHP是開放原始碼的,這使得它的使用比其它同類的Web指令碼語言更為廣泛,它的功能也在不斷的擴充和完善之中。現在最新的PHP版本已經可以很好的支援PDF,XML等。透過系統提供的,我們能非常快捷的生成PDF文件,而最具魅力的是,我們可以透過PHP,查詢資料庫或XML資料檔案並將結果插入所生成的PDF文件之中,形成各種具有絕佳的瀏覽和列印效果的報表、單據、手冊等。

 

不難看出,結合PHP、XML、PDF三項技術,構造出一種可以線上動態生成PDF文件的系統是極具現實意義的,其主要表現在:

 

  ·文件可以在網路上生成,並透過網路分發。節省大量的人力物力。具有精確美觀的列印效果,真正實現了無紙化辦公。

  ·電子商務交易過程中的各種票據、 憑證都可以透過PHP指令碼程式線上生成,並轉為PDF格式傳送給客戶。

   ·企業MIS系統中各種面向列印的報表的生成,並可直接透過瀏覽器獲得,無須安裝任客戶端,使用極為方便。

·以前檔案流轉是"先列印,後分發",每年花在印刷上的費用是政府、企業沉重的負擔。而PDF文件"先散發,後列印",接件人可以在瀏覽後,再按需要列印。印刷的費用大大減少。而且,很有利於環保事業。

2.  課題簡介

 

   在某些軟體專案的開發過程中,我們遇到一個很關鍵的問題就是大量面向列印的報表、單據的生成。我們知道,HTML適合瀏覽,但不適合格式規範的列印。因此必需找到一種可以由PHP動態生成,且具有良好的列印效果的文件格式。而這正是我研究這個課題的最直接的需求。 明白了這一點,我們就很自然的想到了PDF以及PHP的PDF支援庫PDFLib。透過PDFLib提供的一套API,我們可以很容易在PHP指令碼動態建立PDF文件。但是這只是一套非常基本的,只能進行一些簡單的輸出,如線條、文字、矩形框等,而且每輸出一個物件之前,都要為其指定座標。如果直接使用來這套函式來做一些實際的應用,比如複雜的報表的生成,其困難程度是難以想象的。我們不可能為建立這樣一個報表,而事先算好各個元素的座標,並把單元格用矩形框一個一個的畫出來。

 

所以,我們第一步要做的就是利用PHP物件導向的程式設計方法將這套基本的API進行封裝,以產生多個實用的具有獨立功能的物件模組(如page物件、table物件、text物件等)。應該說,這一塊是此專案最基本,也是最重要的部分。我參考並部分採用

了國外一些類似的開放原始碼的程式,在此基礎上開發出了一套功能較為強大的類庫。大大簡化了PDF文件的生成,特別是其中的table物件,可以象HTML中的TABLE標記一樣任意巢狀,輕鬆快捷的實現各種複雜的表格的繪製(這對動態生成報表是非常有用的)。

 

  生成PDF的問題解決以後,我們面臨了新的問題,舉個例子來說,資料庫查詢頁面如何將包含大量資訊的結果集以及其它資訊傳給PDF生成頁面? 最初我們想到的方法是透過文字檔案傳遞,即在資料庫查詢頁面將資料寫到一個文字檔案當中,並對其

中不同類別的資料定義一套區分的標記,PDF生成頁面讀取此檔案,將內容插入到PDF中。 但是這樣做,並不可靠。因為在這個文字檔案中,我們採用特定的字元(或空格)來分離資料,如果恰好有用資料中也包含同樣的字元或空格呢?可見,以這種方式傳遞資料是有隱患的。其實上面我們提到在文字檔案中用不同的標記區分不同類別的資料。而這正是XML技術的思想。何不一步到為採用XML來作為資料傳遞的手段呢? 況且PHP對XML和XSLT具有很好的支援,透過expat解析器,我們可以任意提取XML文件中的資料,也可以透過PHP的XSLT引擎Sablotron對XML文件進行任意轉換。

 

首先由“XML生成器”將資料(來自資料庫或使用者輸入等)放到一個符合事先定義好的DTD的XML文件中,此文件對其中的資料內容進行描述,不包含任何格式資訊。 然後由“XML轉換器”將這個XML文件轉換成包含顯示樣式資訊的另一個XML文件。 最後由“PDF生成器”讀取這個文件,根據其中的內容和顯示樣式生成相應的PDF文件。在這一個過程中,我要做的是再次運用 PHP的物件導向特性,構建出可重用的類:XMLWriter(生成XML檔案)、XMLParser(解析XML檔案)以及XMLTranormer(對XSLT函式的封裝)。

 

系統構建成功後,就是具體的應用了。主要是進銷存系統中各種報表、單據的動態生成。

 

3.  可行性分析

 

開發一個功能強大、適應性好的PDF文件線上生成系統,必然需要彈性大、靈活性

高的開發模型。我們提出的基於PHP和XML的PDF文件線上生成技術,為各種面向列印的應用,如報表、單票據、手冊等提供了新的思路。我們用PHP來查詢資料庫,處理使用者輸入,並在此基礎上生成原始的XML文件;然後透過XSLT將該XML文件加上顯示層資訊,生成另外一個新的XML文件。最後利用“PDF生成器”將這個新的XML文件轉化為相應格式的PDF文件。對於最初生成的XML文件,我可以做二度利用,因為該文件包含了所有的有用資訊,可以非常容易的被其它應用程式處理。如果我們想改變資訊在PDF文件顯示的樣式,可以非常容易的實現。只要專門人員修改相應的XSL樣式單檔案即可,不需要對其它環節做任何修改,具有非常好的靈活性。除此之外,PHP、XML、PDF三者都具有極好的可移植性,可以跨平臺使用。 對該系統的研究並非憑空想象的,它建立在直接的需求之上的。到目前為止,這套技術已經投入實際應用,收到了極為滿意的效果。實踐證明,運用PHP和XML開發出的一套線上PDF文件生成系統具有廣闊和非常實際的應用前景。

 

4 總體設計

 

本課題主要完成四個基礎模組的設計及程式設計實現。這四個類模組分別為PDFCreator、XMLWriter、XMLTransfomer以及XMLParser。它們分佈於系統的各個環節之中,具有各自獨立的功能和作用,是系統的核心組成部分(見下圖)。

 

系統構成圖

 

從圖中可見,四者在本系統中又是緊密聯絡的有機整體。XMLWriter作為系統的輸

入介面,負責生成原始的XML資料檔案。該檔案的格式規範(DTD)由我們事先編寫好,而XMLWriter按照該DTD生成相應的XML文件。這個XML文件接著交由XMLTransfomer處理,XMLTransfomer其實是對PHP提供的XSLT函式的封裝,它一般接受兩個引數,其中之一是需要轉換的XML文件,另一個是相應的XSL樣式單檔案。XMLTransfomer正是根據該樣式單檔案將原始的XML文件轉化為符合這個樣式單樣式的另一個XML文件(包含資訊在PDF文件中放置的格式)。然後,這個新的XML檔案繼續交由“PDF生成器”進行處理。而這個過程有分為兩個部分:首先,必需對這個XML文件進行解析,提取其中所需的資料,這一步有XMLParser來完成,XMLParser對此XML文件進行解析,將其轉化為一棵物件樹,XML文件中每一個節點都是一個物件,每個物件都有各自的屬性(即相應節點的所有資訊)。這樣一來,我們可以非常方便的訪問這個XML文件的任意內容。之後,要做的就是將該XML文件中讀出的資訊(包括格式資訊和內容資訊)用PDFCreator轉化為最終的PDF文件的輸出。

 

5.應用示例

 

  在這裡,我們運用上面的這套系統建立一個面向列印的報表——“庫存歷史事

表”。這個報表包含的資訊有:報表名稱(協和庫存歷史事務表)、單位、建表日期等,另外就是從資料庫中提取的資料了,品名(LLPROD)、批號(LLOC)、等級(LCLS)、倉庫(LWHS)、庫位(LLOCT)、數量(LNUM)、日期(LDATE)等。假設我們已經用XMLWriter生成了下面的原始XML文件(report.xml):

 

   

 

庫存歷史事務表

  平方米

   20020611

   

   

   

   W2308

   1234

    a

    01

    0001

    200

    20020609

     

   

    W2307

    4321

    a

    01

    0001

    100

     20020609

     

   

 

該文件包含了這張報表的所有有用資訊,我們需要用特定的XSL樣式單為其加上格式資訊。XMLTransformer轉換的程式碼如下:

  $xslt = new XMLTransformer ("report.xsl", "report.xml");

  $xslt->apply("pdfreport.xml");

?>

 

轉換後生成的新的XML文件如下:

 

 

 

  庫存歷史事務表

 

  單位:平方米

 

 

 

 

 

   

 

 

 

品名批號等級倉庫庫位數量日期
W23081234a01000120020020609
W23074321a01000110020020609

 

 

 

  建表日期:20020611

 

  用XMLParser對該XML文件解析後,得到一個包含所有資訊的物件樹,我們可以非常方便的訪問其中的內容。生成的PDF報表如下圖:

 

 

 程式片斷如下:

 

  include( "../include/pc_init.inc" );?>

  include( "xmlparser.inc" );

$xml=getNode("report.xml");

// get the attrs of root element

$pageSet=$xmlobject->attrs;

// get the report-head

$head=$xmlobject->nodes[0];

// code ignored...

?>

 

  function draw_line(&$parent,$line){

    $line = &pc_create_object( $parent, "line" );

  $line->pc_set_linestyle( $line->attrs["LINETYPE"]);

  $line->pc_set_width( $line->attrs["SIZE"] );

  $line->pc_set_alignment( "center" );

  if($line->attrs["SHOW"]==false){

    $line->pc_set_linecolor( "white" );

  }

  $line->pc_set_margin( array( "top" => $line->attrs["TOP"], "bottom" => $line->attrs["BOTTOM"], "left" => 0, "right" => 0 ) );

  }

 

  function draw_text(&$parent,$text){

  // code ignored...

  }

  function draw_table(&$parent,$table){

  // code ignored...

  }

 

  function addhead(&$parent,$head){

  for($i=0;$i< $head->n;$i++){

  switch ($head->nodes[$i]->name){

  case "LINE":draw_line($parent,$head->nodes[$i]);break;

  case "TEXT":draw_text($parent,$head->nodes[$i]);break;

    }

  }

  }

//..

?>

 // Create a PDF Document

  $PDF = &pc_create_pdf( array( "Author" => "cyman", "Title" => "a report example" ) );

 // Create an A4-format page

  $Page1 = &pc_create_page( $PDF, $pageSet["PAGETYPE"]);

  addhead($Page1,$head);

  $PDF->pc_draw();

?>

 

 

6.總結

  在幾個月來的畢業設計過程中,雖然忙碌,卻非常充實。透過對一個實際的課題的分析,研究,論證,實現。感覺收穫頗多。目前,這套系統已投入使用,收到了非常滿意的效果,可以很容易的做出美觀實用的報表、單據等。但是,由於時間上的倉促以及自己水平的有限,這套系統仍有許多不足之處。其中最遺憾就是,沒有能定義出一套對各種文件(包括報表、單據、手冊等等)都通用的XML標記,並編制通用的程式將這個XML文件轉化為PDF,就如同瀏覽器解析HTML一樣。這樣就不必為每一種文件都定義各自的XML標記並編寫相對應的轉換程式,可以大大提高工作效率。

  雖然畢業設計已經結束,但是我將會今後的日子裡繼續這個課題的研究。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-991631/,如需轉載,請註明出處,否則將追究法律責任。

相關文章