Java 將Word轉為HTML的方法

Mia張發表於2021-10-09

本文介紹如何在JAVA程式中將Word文件通過 Document.saveToFile() 方法轉換為HTML文件。編輯程式碼前,參考如下環境配置,匯入jar包。

【程式環境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 測試文件:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

匯入jar的兩種方法:

方法1:下載jar包到本地,解壓,將本地lib資料夾下的Spire.Doc.jar匯入Java程式,步驟如下:

匯入結果:


方法2 maven程式中需要配置pom.xml檔案,指定maven倉庫路徑和spire.doc.free的依賴,配置內容如下:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>
        </repository>
    </repositories>
 
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>


【Java】

import com.spire.doc.*;
 
 public class WordtoHtml {
     public static void main(String[] args) {
         Document  doc = new Document();
         doc.loadFromFile("樣本.docx");
         doc.saveToFile("wordtohtml.html",FileFormat.Html);
         doc.dispose();
     }
 }


【轉換效果】

Word文件:


轉換後的HTML檔案:



:程式碼中的檔案路徑為IDEA程式專案資料夾路徑,如 F:\IDEAProject\Conversion_Doc\test.docx ,檔案路徑可以另行自定義為其他路徑。


另外可閱讀更多關於Word轉為其他檔案格式的方法:

  • Java 將Word轉為Tiff(http://blog.itpub.net/31499788/viewspace-2776921/)

  • Java 將Word轉為XML以及XML轉為Word的方法(http://blog.itpub.net/31499788/viewspace-2769027/)

  • Java 將Word轉為PDF、PNG、SVG、RTF、XPS、TXT、XML(http://blog.itpub.net/31499788/viewspace-2665858/)


—End—



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31499788/viewspace-2795076/,如需轉載,請註明出處,否則將追究法律責任。

相關文章