使用C#,VB和Java將PDF轉換為DOC / DOCX

roffey發表於2021-03-11

LEADTOOLS Recognition Imaging SDK是精選的LEADTOOLS SDK功能集,旨在在企業級文件自動化解決方案中構建端到端文件成像應用程式,這些解決方案需要OCR,MICR,OMR,條形碼,表單識別和處理,PDF,列印捕獲 ,檔案,註釋和影像檢視功能。 這套功能強大的工具利用LEAD屢獲殊榮的影像處理技術,智慧識別可用於識別和提取任何型別的掃描或傳真形式影像資料的文件功能。

有許多原因可能導致您想要與PDF文件進行轉換。也許您需要使PDF可編輯或文字可搜尋。或者,也許您更希望PDF是DOC或DOCX檔案,但是您不想複製/貼上文字或丟失原始格式。您甚至可能需要以相同的方式批次轉換大量PDF。好訊息!該 LEADTOOLS文件轉換器SDK 是一個簡單的工具能夠處理所有的文件和影像轉換的需求結合起來。

在後臺,Document Converter使用人工智慧來選擇LEADTOOLS Raster, SVG, OCR和 Document Writer 技術的正確組合, 以快速而精確地轉換影像和文件。

在接下來的幾週中,我們將透過向您展示如何在特定格式之間進行轉換,來證明我們的文件轉換技術的多功能性。今天的部落格重點介紹如何將PDF轉換為Word格式(DOC / DOCX)。

在C#中將PDF轉換為DOC或DOCX

使用LEADTOOLS輕鬆將PDF轉換為Word(DOC / DOCX)文件。下面的示例使用C#,但是LEADTOOLS支援其他幾種語言,包括Java和VB。首先,匯入LEADTOOLS SDK。

using Leadtools;
using Leadtools.Codecs;
using Leadtools.Document.Converter;
using Leadtools.Document.Writer;
using Leadtools.Ocr;

然後,初始化文件轉換器。

namespace Convert_Files_with_Document_Converter
{
 class Program
 {
  static void Main(string[] args)
  {
   string directory = @"C:\InputFileDirectory";
   SetLicense();
   using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
   using (DocumentConverter docConverter = new DocumentConverter())
   {
    ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS21\Bin\Common\OcrLEADRuntime");
    docConverter.SetOcrEngineInstance(ocrEngine, false);
    // Change the DocumentFormat enumeration to whichever format is needed
    ConvertToDocument(directory, docConverter, DocumentFormat.Doc);
   }
  }
 }
}

最後,轉換文件。

static void ConvertToDocument(string directory, DocumentConverter docConverter, DocumentFormat docFormat)
{
 string[] files = Directory.GetFiles(directory, "*.pdf");
 string outputDir = Path.Combine(directory, "Converted");
 if (!Directory.Exists(outputDir))
  Directory.CreateDirectory(outputDir);
 foreach (string file in files)
 {
  Console.WriteLine($"Converting {file}...");
  string fileName = Path.GetFileNameWithoutExtension(file);
  string ext = DocumentWriter.GetFormatFileExtension(docFormat);
  string outFile = Path.Combine(outputDir, $"{fileName}.{ext}");
  DocumentConverterJobData jobData = DocumentConverterJobs.CreateJobData(file, outFile, docFormat);
  jobData.JobName = "Convert to Image Job";
  DocumentConverterJob job = docConverter.Jobs.CreateJob(jobData);
  docConverter.Jobs.RunJob(job);
  if (job.Errors.Count > 0)
   foreach (var error in job.Errors)
    Console.WriteLine($"Error during conversion: {error.Error.Message}\n");
  else
   Console.WriteLine($"Successfully Convereted {file} to {outFile}\n");
 }
}

在Visual Basic中將PDF轉換為DOC或DOCX

LEADTOOLS還支援Visual Basic .NET應用程式。只需使用下面的功能,即可將LEADTOOLS Document Converter整合到您的應用程式中。

Public Sub DocumentConverterExample()
 Using documentConverter As New DocumentConverter()
  Dim inFile As String = Path.Combine(ImagesPath.Path, "Leadtools.pdf")
  Dim outFile As String = Path.Combine(ImagesPath.Path, "output.doc")
  Dim format As DocumentFormat = DocumentFormat.Doc
  Dim jobData As DocumentConverterJobData = DocumentConverterJobs.CreateJobData(inFile, outFile, format)
  jobData.JobName = "conversion job"
  Dim job As DocumentConverterJob = documentConverter.Jobs.CreateJob(jobData)
  documentConverter.Jobs.RunJob(job)
  If job.Status = DocumentConverterJobStatus.Success Then
   Console.WriteLine("Success")
  Else
   Console.WriteLine("{0} Errors", job.Status)
   For Each errorItem As DocumentConverterJobError In job.Errors
    Console.WriteLine("  {0} at {1}: {2}", errorItem.Operation, errorItem.InputDocumentPageNumber, errorItem.Error.Message)
   Next
  End If
 End Using
End Sub

用Java將PDF轉換為DOC或DOCX

使用LEADTOOLS Java Document Converter時發現了類似的方法。在Java中,應用程式將使用以下功能建立轉換作業。

static void ConvertToDocument(String inputFile, DocumentConverter docConverter, OcrEngine ocrEngine)
{
 DocumentWriter docWriter = new DocumentWriter();
 ocrEngine.startup(new RasterCodecs(), docWriter, null, null);
 String outputFile = "C:\\LEADTOOLS21\\Resources\\Images\\documentConverter.pdf";
 docConverter.setDocumentWriterInstance(docWriter);
 docConverter.setOcrEngineInstance(ocrEngine, true);
 DocumentConverterJobData jobData = DocumentConverterJobs.createJobData(inputFile, outputFile, DocumentFormat.Doc);
 jobData.setJobName("DocumentConversion");
 DocumentConverterJob job = docConverter.getJobs().createJob(jobData);
 docConverter.getJobs().runJob(job);
 if (job.getErrors().size() > 0)
  for (DocumentConverterJobError error : job.getErrors())
   System.out.println("\nError during conversion: " + error.getError().getMessage());
 else
  System.out.println("Successfully converted file to " + outputFile);
}

有關Java文件轉換器的更多資訊,請檢視我們有關LEADTOOLS Java文件轉換器的完整教程 。

這就是將檔案從PDF轉換為Word格式的全部,但是為什麼到此為止呢?檢視所有 LEADTOOLS支援的格式。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995027/viewspace-2762322/,如需轉載,請註明出處,否則將追究法律責任。

相關文章