XML 程式設計思想: 專利編檔遭遇 XML(轉)

amyz發表於2007-08-12
XML 程式設計思想: 專利編檔遭遇 XML(轉)[@more@]

  大型的專利組織都抱有雙重目標:一方面簡化電子專利編檔,另一方面保持這種檔案在部門之間的相容性。這方面努力的背後,XML 技術發揮著領導作用,圍繞著專利編檔的 XML 格式進行了很多思考和工作。本欄目中,Uche Ogbuji 分析了 XML 專利電子編檔的背景,並和專利專家 Carl Oppedahl 討論了 XML 編檔的實際情況。

  United States Patent and Trademark Office (USPTO)一直努力將電子編檔付諸實踐。對於一個主要職責就是和關注未來的客戶打交道的部門而言,這並不奇怪。況且大型專利部門要處理海量的資料,他們需要能得到的一切幫助來保持資料流的清晰。從 1998 到 2000 年,USPTO 為專利文件開發了 SGML DTD,2000 年該機構開始把目光投向 XML,啟動了一項新的計劃,準備到 2002 年開發出 XML DTD。這項研究還擴充套件到了和商標有關的文件。

  這一努力中 USPTO 並不孤單,還有其他兩家大型專利機構: European Patent Office (EPO)和 Japan Patent Office (JPO)。後者是電子編檔的先驅,可以追溯到 1990 年。其中作為協調專利機構的國際權威, World Intellectual Property Organization (WIPO) 正致力於關於專利編檔和處理的資料交換的標準化。WIPO 標準稱為 Electronic Patent Cooperation Treaty (E-PCT)或 Annex F。它包括一組 XML DTD,類似但不同於大型專利機構開發的那些 DTD。本文簡要討論標準電子專利編檔的 WIPO XML 格式,並就 XML 有關的專利編檔與一位專家進行探討。

  E-PCT DTD

  從 WIPO 網站上查詢真正的 XML DTD 碰了幾次壁後,我終於在 OASIS Cover Pages(請參閱 參考資料)上找到了 2001 年 6 月的專利申請主體的 E-PCT DTD 工作草案。該模式顯然是由理解 XML 並瞭解資訊體系結構的人設計的。非常清晰,任何熟悉 XML 的人即使不瞭解專利編檔也可以使用。

  我發現該 DTD 中主要的毛病是一些完全不必要的縮寫。多數元素都涉及散文體的內容,遵循類似 XHTML 和 Docbook 的慣例(儘管名稱和那些標準不一定相同)。表格模型基於人所共知的 CALS 標準,其中包括用於個人以及組織名稱、地址、文獻引用和專利交叉索引的設計好的內容模型。它還包括 MathML DTD 以處理公式(化學和數學公式也可以作為特殊型別的圖片包含進來),並提供了生物學資料參考。後設資料元素提供了專利專用的後設資料,但多數和編檔有關的法律細節似乎要留待其他 DTD 完成。

  專利電子編檔還具有互操作性嗎?

  USPTO 所支援的電子編檔方法需要使用一個名為 PASAT 的應用程式編輯專利申請,還有一個應用程式 ePave 用於提交和其他任務。對 PASAT 的不滿可以看作是電子編檔沒有推廣的原因之一,但因為其輸出是 DTD 已公開的 XML,應該能夠使用任何適當的工具編輯,這種能力被稱為 跨平臺的編檔。可以選擇的一種工具稱為 PatXML,來自 EPO。另外一種是 PCT-SAFE Editor (PSE),WIPO 提供的 E-PCT 編檔工具。這兩種工具都支援匯出到 USPTO XML 編檔格式。開發 Annex-F 的最終目標之一是使所有編檔人員能夠選用喜歡的任何編輯工具——無論是專利機構開發的還是商業軟體廠商提供的——並且所有主要專利機構都能夠電子化地歸檔所生成的申請。人們期望 XML 在所有這類系統中的應用能夠加速整合的程式。

  與 Carl Oppedahl 的對話

  Oppedahl & Larson LLP 法律服務公司提供專利、版權、商標和其他智慧財產權服務。他們以緊跟技術前進的步伐而自豪,事實上他們很早就出現在 Internet 上並獲得了域名“patents.com”。他們也是基於 XML 的電子編檔方式的最早採用者之一,發表了一些有用的文章指導此類系統的應用。這些文章在有關 XML 驅動的系統之間的互操作性問題方面提供了有趣的經驗。

  我就跨平臺編檔的實際問題採訪了Oppedahl & Larson LLP 的合夥人 Carl Oppedahl,從他的文章中我得知他在技術(包括 XML)和法律方面都有淵博的知識。

  Uche Ogbuji:業界對 PASAT 抱怨什麼,為什麼一些使用者喜歡用 PatXML 和 PCT-SAFE?

Carl Oppedahl:PASAT 是十多年前開發的,人們發現這個程式不太穩定——有時候會突然崩潰,所做的工作也丟失了。其他的編輯工具如 PatXML 和 PCT-SAFE Editor 是最近開發的,更加穩定。 還有一個區別可能對某些使用者很重要,PCT-SAFE Editor 是一種有效的 XML 編輯器,其使用者介面符合人們對標籤式(如 HTML、SGML 或 XML)編輯器的期望。使用 PCT-SAFE Editor 建立和編輯——也需跨越好幾天——的檔案是一個 XML 檔案。 也許最好把 PASAT 和 PatXML 稱作 XML“編輯工具”。這些程式建立的檔案都採用某種非 XML 的私有格式。作為使用者,您可以單擊一個按鈕“匯出 XML”,這時候程式將建立一個新的檔案,這個檔案是一個 XML 檔案。 因此對一些使用者而言——比如在使用電子編檔專利申請之前已經熟悉 HTML 編碼的使用者,PCT-SAFE Editor 可能提供了一種更加熟悉的使用者介面。

  UO:您用過專利申請不是 XML 格式的電子編檔工具嗎?如果是這樣,XML 的應用對使用者的體驗有很大的影響嗎?


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752019/viewspace-950169/,如需轉載,請註明出處,否則將追究法律責任。

相關文章