C# 將PDF轉為Excel

Mia張發表於2022-04-08

通常,PDF格式的文件能支援的編輯功能不如office文件多,針對PDF文件裡面有表格資料的,如果想要編輯表格裡面的資料,可以將該PDF文件轉為Excel格式,然後編輯。本文,將以C#程式碼為例,介紹如何實現由PDF格式到Excel文件格式的轉換。下面是具體步驟。

【dll引用方法】

方法1

在程式中引入Spire.Pdf.dll檔案;將 Spire.PDF for .NET 下載到本地,解壓,安裝。安裝完成後,找到安裝路徑下BIN資料夾中的Spire.Pdf.dll。然後在Visual Studio中開啟“解決方案資源管理器”,滑鼠右鍵點選“引用”,“新增引用”,將本地路徑BIN資料夾下的dll檔案新增引用至程式。

方法2

通過 NuGet 安裝。可通過以下2種方法安裝:

1.可以在Visual Studio中開啟“解決方案資源管理器”,滑鼠右鍵點選“引用”,“管理NuGet包”,然後搜尋“Spire.PDF”,點選“安裝”。等待程式安裝完成。

  2.將以下內容複製到PM控制檯安裝:Install-Package Spire.PDF -Version 8.3.9

【PDF轉Excel】

轉換時,可通過以下步驟來實現,僅需要三行程式碼:

  • 建立PdfDocument類的物件。
  • 呼叫PdfDocument.LoadFromFile(string filename)方法載入PDF文件。
  • 通過PdfDocument.SaveToFile(string filename, FileFormat fileFormat)方法將檔案儲存為Excel格式到指定路徑。

C#

using Spire.Pdf;

namespace PDFtoExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //載入PDF文件
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("test.pdf");

            //儲存為Excel文件
            pdf.SaveToFile("ToExcel.xlsx",FileFormat.XLSX);
        }
    }
}

VB.NET

Imports Spire.Pdf

Namespace PDFtoExcel
    Class Program
        Private Shared Sub Main(args As String())
            '載入PDF文件
            Dim pdf As New PdfDocument()
            pdf.LoadFromFile("test.pdf")

            '儲存為Excel文件
            pdf.SaveToFile("ToExcel.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace

用於轉換的PDF文件,包含9頁內容:

轉換時,是將原有PDF每頁單獨轉換為一個sheet頁,如圖,轉換後的Excel文件包含9個sheet頁:

 

  —END—

 

相關文章