Java 獲取Word字數

Mia張發表於2021-12-14

本文以Java程式碼為例介紹如何來獲取Word字數。本次使用Jar包- Free Spire.Doc for Java來實現,通過該Jar包中的 Document.getBuiltinDocumentProperties()屬性獲取有關Word文件中字數的屬性,如字數、字元數、頁數、段落數等等。具體方法和步驟如下:

1. 匯入jar包

方法1 :Maven 倉庫下載。

在pom.xml中配置如下內容匯入:

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <url>
        </repository>
    </repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc.free</artifactId>
        <version>3.9.0</version>
    </dependency>
</dependencies>

方法2 :手動匯入。

下載jar包到本地,解壓,找到lib資料夾下的Spire.Doc.jar檔案。然後在IDEA中執行如下操作完成匯入:


2. Java 程式碼

import com.spire.doc.*;
 
 public class WordCount {
     public static void main(String[] args) {
         //載入Word文件
         Document document = new Document();
         document.loadFromFile("test.docx");
 
         int pagecount = document.getBuiltinDocumentProperties().getPageCount();//獲取頁數
         int wordcount = document.getBuiltinDocumentProperties().getWordCount();//獲取字數
         int charcount = document.getBuiltinDocumentProperties().getCharCount();//獲取字元數(不計空格)
         int charcountwithSpace = document.getBuiltinDocumentProperties().getCharCountWithSpace();//獲取字元數(計空格)
         int paragraphcount = document.getBuiltinDocumentProperties().getParagraphCount();//獲取段落數
         int linecount = document.getBuiltinDocumentProperties().getLinesCount();//獲取行數
 
         System.out.println("頁數:" + pagecount +"\n"
                          + "字數: " + wordcount +"\n"
                          + "字元數(不計空格):" + charcount +"\n"
                          + "字元數(計空格):"+ charcountwithSpace +"\n"
                          + "段落數:"+ paragraphcount +"\n"
                          + "行數:" + linecount +"\n");
 
     }
 }

執行程式,讀取結果如下:


—End—



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31499788/viewspace-2847710/,如需轉載,請註明出處,否則將追究法律責任。

相關文章