將PDF檔案轉換為Markdown格式是一個非常實用的需求,尤其是在需要將內容從固定佈局的PDF檔案中提取出來,並轉換為更易於編輯和處理的文字格式時。本文將介紹如何透過C#程式碼將PDF文件轉換Markdown(MD)文件。
需要用到第三方庫 Spire.PDF for .NET。可以從以下連結下載產品包後手動新增引用,或者直接透過NuGet安裝。
https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html
C# 將PDF轉為Markdown文件
步驟:
- 建立 PdfDocument 類的物件
- 透過 LoadFromFile() 方法載入PDF文件;
- 透過 SaveToFile(string filename, FileFormat.Markdown) 將載入的PDF文件轉換為markdown文件。
示例程式碼:
using Spire.Pdf; namespace PDFToMarkdown { class Program { static void Main(string[] args) { //載入PDF文件 PdfDocument pdf = new PdfDocument(); pdf.LoadFromFile("測試.pdf"); //將PDF轉換為MD文件 pdf.SaveToFile("PDF轉Markdown.md", FileFormat.Markdown); pdf.Close(); } } }
該Spire.PDF for .NET庫支援多種在.NET 程式建立、讀取、轉換、列印PDF文件的操作,更多示例可以參考:
https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html
對於生成文件中的水印,點選申請臨時授權移除並完整試用:
https://www.e-iceblue.cn/misc/temporary-license.html