C# 將PDF文件轉換為Markdown文件

E-iceblue發表於2024-11-01

將PDF檔案轉換為Markdown格式是一個非常實用的需求,尤其是在需要將內容從固定佈局的PDF檔案中提取出來,並轉換為更易於編輯和處理的文字格式時。本文將介紹如何透過C#程式碼將PDF文件轉換Markdown(MD)文件。

需要用到第三方庫 Spire.PDF for .NET。可以從以下連結下載產品包後手動新增引用,或者直接透過NuGet安裝。

https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html

C# 將PDF轉為Markdown文件

步驟:

  1. 建立 PdfDocument 類的物件
  2. 透過 LoadFromFile() 方法載入PDF文件;
  3. 透過 SaveToFile(string filename, FileFormat.Markdown) 將載入的PDF文件轉換為markdown文件。

示例程式碼:

using Spire.Pdf;

namespace PDFToMarkdown
{
    class Program
    {
        static void Main(string[] args)
        {
            //載入PDF文件
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("測試.pdf");

            //將PDF轉換為MD文件
            pdf.SaveToFile("PDF轉Markdown.md", FileFormat.Markdown);
            pdf.Close();
        }
    }
}


該Spire.PDF for .NET庫支援多種在.NET 程式建立、讀取、轉換、列印PDF文件的操作,更多示例可以參考:

https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html

對於生成文件中的水印,點選申請臨時授權移除並完整試用:

https://www.e-iceblue.cn/misc/temporary-license.html

相關文章