Java 獲取Word中的標題大綱(目錄)

iceblue發表於2021-04-13

概述

Word中的標題可通過“樣式”中的選項來快速設定(如圖1),

圖1

 

在新增目錄時,可將“有效樣式”設定為“目錄級別”顯示(如圖2),一定程度上來說,標題大綱也可以作為目錄來參考。

圖2

本文,將通過後端Java程式程式碼介紹如何來獲取Word中的標題內容。

注:如果在Word中進行了如圖2中的設定,此方法也可以作為獲取目錄的方法;若沒有對應設定,則想要通過此方法來獲取的目錄內容可能不完整。

 

本次測試的Word文件如下圖所示,【標題樣式】和【目錄級別】經過相應設定,在獲取標題大綱時等同於獲取目錄:

圖3

程式碼測試環境

  • Word測試文件:.docx 2013版
  • 編譯環境:IntelliJ IDEA 2018
  • Jdk版本:1.8.0
  • Word jar包:free spire.doc.jar 3.9.0

 

Java 程式程式碼

import com.spire.doc.*;
import com.spire.doc.documents.Paragraph;

import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;


public class GetTitle {
    public static void main(String[] args)throws IOException {
        //載入Word測試文件
        Document doc = new Document();
        doc.loadFromFile("sample.docx");

        //儲存標題內容到.txt文件
        File file = new File("GetTitle.txt");
        if (file.exists())
        {
            file.delete();
        }
        file.createNewFile();
        FileWriter fw = new FileWriter(file, true);
        BufferedWriter bw = new BufferedWriter(fw);

        //遍歷section
        for (int i = 0; i < doc.getSections().getCount(); i++)
        {
            Section section = doc.getSections().get(i);
            //遍歷Paragraph
            for (int j = 0; j < section.getParagraphs().getCount(); j++)
            {
                Paragraph paragraph = section.getParagraphs().get(j);

                //獲取標題
                if ( paragraph.getStyleName().matches("1"))//段落為“標題1”的內容
                {
                    //獲取段落標題內容
                    String text = paragraph.getText();

                    //寫入文字到txt文件
                    bw.write("標題1: "+ text + "\r");
               }
                //獲取標題
                if ( paragraph.getStyleName().matches("2"))//段落為“標題2”的內容
                {
                    //獲取段落標題內容
                    String text = paragraph.getText();

                    //寫入文字到txt文件
                    bw.write("標題2: " + text + "\r");
                }
                //獲取標題
                if ( paragraph.getStyleName().matches("3"))//段落為“標題3”的內容
                {
                    //獲取段落標題內容
                    String text = paragraph.getText();

                    //寫入文字到txt文件
                    bw.write("標題3: " + text+"\r");
                }
                //獲取標題
                if ( paragraph.getStyleName().matches("4"))//段落為“標題4”的內容
                {
                    //獲取段落標題內容
                    String text = paragraph.getText();

                    //寫入文字到txt文件
                    bw.write("標題4: " + text+"\r");
                }

                bw.write("\n");
            }

        }
        bw.flush();
        bw.close();
        fw.close();
    }
}

標題(目錄)獲取結果:

 

本文完。

原創內容,如需轉載,請註明出處!

 

相關文章