使用C#,VB和Java將PDF轉換為DOC / DOCX
LEADTOOLS Recognition Imaging SDK是精選的LEADTOOLS SDK功能集,旨在在企業級文件自動化解決方案中構建端到端文件成像應用程式,這些解決方案需要OCR,MICR,OMR,條形碼,表單識別和處理,PDF,列印捕獲 ,檔案,註釋和影像檢視功能。 這套功能強大的工具利用LEAD屢獲殊榮的影像處理技術,智慧識別可用於識別和提取任何型別的掃描或傳真形式影像資料的文件功能。
有許多原因可能導致您想要與PDF文件進行轉換。也許您需要使PDF可編輯或文字可搜尋。或者,也許您更希望PDF是DOC或DOCX檔案,但是您不想複製/貼上文字或丟失原始格式。您甚至可能需要以相同的方式批次轉換大量PDF。好訊息!該 LEADTOOLS文件轉換器SDK 是一個簡單的工具能夠處理所有的文件和影像轉換的需求結合起來。
在後臺,Document Converter使用人工智慧來選擇LEADTOOLS Raster, SVG, OCR和 Document Writer 技術的正確組合, 以快速而精確地轉換影像和文件。
在接下來的幾週中,我們將透過向您展示如何在特定格式之間進行轉換,來證明我們的文件轉換技術的多功能性。今天的部落格重點介紹如何將PDF轉換為Word格式(DOC / DOCX)。
在C#中將PDF轉換為DOC或DOCX
使用LEADTOOLS輕鬆將PDF轉換為Word(DOC / DOCX)文件。下面的示例使用C#,但是LEADTOOLS支援其他幾種語言,包括Java和VB。首先,匯入LEADTOOLS SDK。
using Leadtools; using Leadtools.Codecs; using Leadtools.Document.Converter; using Leadtools.Document.Writer; using Leadtools.Ocr;
然後,初始化文件轉換器。
namespace Convert_Files_with_Document_Converter { class Program { static void Main(string[] args) { string directory = @"C:\InputFileDirectory"; SetLicense(); using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD)) using (DocumentConverter docConverter = new DocumentConverter()) { ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS21\Bin\Common\OcrLEADRuntime"); docConverter.SetOcrEngineInstance(ocrEngine, false); // Change the DocumentFormat enumeration to whichever format is needed ConvertToDocument(directory, docConverter, DocumentFormat.Doc); } } } }
最後,轉換文件。
static void ConvertToDocument(string directory, DocumentConverter docConverter, DocumentFormat docFormat) { string[] files = Directory.GetFiles(directory, "*.pdf"); string outputDir = Path.Combine(directory, "Converted"); if (!Directory.Exists(outputDir)) Directory.CreateDirectory(outputDir); foreach (string file in files) { Console.WriteLine($"Converting {file}..."); string fileName = Path.GetFileNameWithoutExtension(file); string ext = DocumentWriter.GetFormatFileExtension(docFormat); string outFile = Path.Combine(outputDir, $"{fileName}.{ext}"); DocumentConverterJobData jobData = DocumentConverterJobs.CreateJobData(file, outFile, docFormat); jobData.JobName = "Convert to Image Job"; DocumentConverterJob job = docConverter.Jobs.CreateJob(jobData); docConverter.Jobs.RunJob(job); if (job.Errors.Count > 0) foreach (var error in job.Errors) Console.WriteLine($"Error during conversion: {error.Error.Message}\n"); else Console.WriteLine($"Successfully Convereted {file} to {outFile}\n"); } }
在Visual Basic中將PDF轉換為DOC或DOCX
LEADTOOLS還支援Visual Basic .NET應用程式。只需使用下面的功能,即可將LEADTOOLS Document Converter整合到您的應用程式中。
Public Sub DocumentConverterExample() Using documentConverter As New DocumentConverter() Dim inFile As String = Path.Combine(ImagesPath.Path, "Leadtools.pdf") Dim outFile As String = Path.Combine(ImagesPath.Path, "output.doc") Dim format As DocumentFormat = DocumentFormat.Doc Dim jobData As DocumentConverterJobData = DocumentConverterJobs.CreateJobData(inFile, outFile, format) jobData.JobName = "conversion job" Dim job As DocumentConverterJob = documentConverter.Jobs.CreateJob(jobData) documentConverter.Jobs.RunJob(job) If job.Status = DocumentConverterJobStatus.Success Then Console.WriteLine("Success") Else Console.WriteLine("{0} Errors", job.Status) For Each errorItem As DocumentConverterJobError In job.Errors Console.WriteLine(" {0} at {1}: {2}", errorItem.Operation, errorItem.InputDocumentPageNumber, errorItem.Error.Message) Next End If End Using End Sub
用Java將PDF轉換為DOC或DOCX
使用LEADTOOLS Java Document Converter時發現了類似的方法。在Java中,應用程式將使用以下功能建立轉換作業。
static void ConvertToDocument(String inputFile, DocumentConverter docConverter, OcrEngine ocrEngine) { DocumentWriter docWriter = new DocumentWriter(); ocrEngine.startup(new RasterCodecs(), docWriter, null, null); String outputFile = "C:\\LEADTOOLS21\\Resources\\Images\\documentConverter.pdf"; docConverter.setDocumentWriterInstance(docWriter); docConverter.setOcrEngineInstance(ocrEngine, true); DocumentConverterJobData jobData = DocumentConverterJobs.createJobData(inputFile, outputFile, DocumentFormat.Doc); jobData.setJobName("DocumentConversion"); DocumentConverterJob job = docConverter.getJobs().createJob(jobData); docConverter.getJobs().runJob(job); if (job.getErrors().size() > 0) for (DocumentConverterJobError error : job.getErrors()) System.out.println("\nError during conversion: " + error.getError().getMessage()); else System.out.println("Successfully converted file to " + outputFile); }
有關Java文件轉換器的更多資訊,請檢視我們有關LEADTOOLS Java文件轉換器的完整教程 。
這就是將檔案從PDF轉換為Word格式的全部,但是為什麼到此為止呢?檢視所有 LEADTOOLS支援的格式。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69995027/viewspace-2762322/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- C#/VB.NET 將彩色PDF轉為灰度C#
- doc轉docx(java-python)JavaPython
- C# 將PDF文件轉換為Markdown文件C#
- 初探JavaScript PDF blob轉換為Word docx方法JavaScript
- Java 將Markdown檔案轉換為Word和PDF文件Java
- 10個DOC轉為DOCX的最佳工具
- Java 將PDF轉為PDF/AJava
- C#/VB.NET 將RTF轉為HTMLC#HTML
- C#/VB.NET 將Html轉為ExcelC#HTMLExcel
- C# 將OFD轉為PDFC#
- C# 將PDF轉為ExcelC#Excel
- C# 將PDF轉為線性化PDFC#
- C#/VB.NET 將OFD儲存為PDF檔案流C#
- Java 將PDF轉為線性PDFJava
- 自己動手做一個批次doc轉換為docx檔案的小工具
- Java 將Html轉為PDF(二)JavaHTML
- Java將彩色PDF轉為灰度Java
- Java中將XML轉換為PDF的兩種辦法JavaXML
- C#將html轉pdfC#HTML
- RTF 批量轉換為 DOCX 檔案
- C#/VB.NET 實現Word和ODT文件相互轉換C#
- Linux上使用python處理docx轉pdf教程LinuxPython
- aspose word轉換pdf檔案後將pdf檔案轉換為圖片png
- Python實現批次將ppt轉換為pdfPython
- 如何使用預覽將多個影像轉換為單個PDF
- PDF批次轉換器,批次轉word為pdf,批次轉ppt為pdf
- Python 將PDF轉為PDF/A、PDF/X,以及PDF/A轉回PDFPython
- stirlingpdf PDF 工具將PDF轉換成Word
- 利用vbs指令碼將word文件轉換為pdf指令碼
- 如何將 PowerPoint 簡報轉換為 PDF 檔案?
- XLSX轉換為DOCX,Aspose.Cells快速搞定
- Java 將PDF轉為HTML時儲存到流JavaHTML
- Java 將PDF轉為透明背景的圖片Java
- Java 中將 InputStream 轉換為 StreamJava
- Java 中將 Short 轉換為 byte[]Java
- 小技巧:如何使用預覽將多個影像轉換為單個PDF
- Java 將PDF/XPS轉為Word/html /SVG/PS/PCL/PNG、PDF和XPS互轉(基於Spire.Cloud.SDK for Java)JavaHTMLSVGCloud
- C#/VB.NET 合併PDF頁面C#