Java 將Word轉為HTML的方法

Mia張 發表於 2021-10-09
Java

本文介紹如何在JAVA程式中將Word文件通過 Document.saveToFile() 方法轉換為HTML文件。編輯程式碼前,參考如下環境配置,匯入jar包。

【程式環境】

1. IntelliJ IDEA 2018( jdk 1.8.0)

2. 測試文件:Word 2013(.docx)

3. Jar包:Free Spire.Doc for Java 3.9.0

匯入jar的兩種方法:

方法1下載jar包到本地,解壓,將本地lib資料夾下的Spire.Doc.jar匯入Java程式,步驟如下:

Java 將Word轉為HTML的方法

 Java 將Word轉為HTML的方法

 Java 將Word轉為HTML的方法

 

匯入結果:

Java 將Word轉為HTML的方法

 

方法2maven程式中需要配置pom.xml檔案,指定maven倉庫路徑和spire.doc.free的依賴,配置內容如下:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>http://repo.e-iceblue.cn/repository/maven-public/</url>
        </repository>
    </repositories>

<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>

【Java】

import com.spire.doc.*;

public class WordtoHtml {
    public static void main(String[] args) {
        Document  doc = new Document();
        doc.loadFromFile("test.docx");
        doc.saveToFile("wordtohtml.html",FileFormat.Html);
        doc.dispose();
    }
}

轉換效果

Word測試文件:

Java 將Word轉為HTML的方法

 

轉換後的HTML檔案:

Java 將Word轉為HTML的方法

 

注:程式碼中的檔案路徑為IDEA程式專案資料夾路徑,如 F:\IDEAProject\Conversion_Doc\test.docx ,檔案路徑可以另行自定義為其他路徑。

 

—End—