HtmlCleaner2.0

chszs發表於2008-07-18
版權宣告:本文為博主chszs的原創文章,未經博主允許不得轉載。 https://blog.csdn.net/chszs/article/details/2670661
HtmlCleaner2.0

HtmlCleaner是一個Java庫,用於安全地解析和轉換Web上的任何HTML頁面為良好定義的XML。它設計的非常小、快速、靈活和獨立。

HtmlCleaner可以用在Java程式碼中,作為命令列工具或Ant任務。其解析的結果是輕量級的DOM,能輕易地轉換成類似DOM或JDOM的標準,或以各種方式(緊湊格式,美觀格式等)序列化為XML輸出。

新版本的重大改進:
1)HtmlCleaner的DOM現在有大量的操縱節點和屬性的方法,易於在序列化前進行搜尋或修改。
2)HtmlCleaner DOM支援基本的XPath。
3)建立定製標籤集和規則現在比使用XML配置檔案更容易。
4)很多Bug和API改進。