入門練習
首先會需要兩個jar包檔案 itext-5.5.5和text-asian.jar,可以在我上傳的資源處下載。
將這兩個jar包新增到專案中。
然後編寫簡單的測試Demo
/**
*
*/
package com.skd.util;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.Writer;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
import com.itextpdf.text.Document;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.Font;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.BaseFont;
import com.itextpdf.text.pdf.PdfWriter;
/**
* @author JING
* @date 2015年4月28日
* @time 下午9:11:14
* @fileName Office2PDF.java
* @function
*/
public class Office2PDF {
static final String PDF_SUFFIX=".PDF";
static final String TXT_SUFFIX=".txt";
static final String JAVA_SUFFIX=".java";
static final String DOCX_SUFFIX=".docx";
static final String DOC_SUFFIX=".doc";
/**
* @param args
* @throws Exception
* @throws IOException
*/
public static void main(String[] args) throws IOException, Exception {
//這兩個路徑可以指定為自己的文字檔案路徑,不帶副檔名
String filePath="D:\\test_data\\開發";
String pdfPath=filePath+PDF_SUFFIX;
String txtPath=filePath+JAVA_SUFFIX;
//文字檔案轉為pdf檔案
//txt2Pdf(txtPath, pdfPath);
//獲取pdf檔案中的內容並儲存在同名的文字檔案中
//getPdf(pdfPath);
System.out.println("結束");
}
/**
* 獲取pdf檔案中的內容並儲存在同名的文字檔案中
* @param pdfPath
* @throws IOException
*/
public static void getPdf(String pdfPath) throws IOException {
//是否排序
boolean sort=false;
//pdf檔名
String fileName=pdfPath;
//讀取檔案的內容
String pdfContent=null;
//編碼方式
String encoding="UTF-8";
//開始提取頁
int startPage=1;
//結束提取頁
int endPage=Integer.MAX_VALUE;
//檔案輸入流
Writer writer=null;
PDDocument doc=null;
doc=PDDocument.load(fileName);
if(fileName.length() > 4){
//以原來pdf名稱來命名新產生的txt檔案
File outputFile = new File(fileName.substring(0, fileName.length()-4) + ".txt");
fileName = outputFile.getPath();
}
//檔案輸出流,寫入到filename中
writer=new OutputStreamWriter(new FileOutputStream(fileName), encoding);
PDFTextStripper pdfTextStripper = new PDFTextStripper();
pdfTextStripper.setSortByPosition(sort);
pdfTextStripper.setStartPage(startPage);
pdfTextStripper.setEndPage(endPage);
//呼叫PDFTextStripper的writeText
pdfTextStripper.writeText(doc,writer );
writer.close();
if(writer != null){
}
doc.close();
if(doc != null){
}
}
/**
* 文字檔案轉為pdf檔案
* @param txtPath
* @param pdfPath
* @throws IOException
* @throws DocumentException
*/
public static void txt2Pdf(String txtPath,String pdfPath) throws IOException, DocumentException {
Document document = new Document();
//系統字型的路徑C:\Windows\Fonts\SIMKAI.TTF 楷體常規 放置在專案src下的res下。不設定字型不顯示中文
//BaseFont bfChinese = BaseFont.createFont("res/SIMKAI.TTF",BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); //"fonts/UniGB-UCS2-H"
BaseFont bfChinese = BaseFont.createFont("STSongStd-Light","UniGB-UCS2-H", BaseFont.EMBEDDED);
Font FontChinese = new Font(bfChinese, 12,Font.NORMAL);
try {
BufferedReader reader=new BufferedReader(new InputStreamReader(new FileInputStream(txtPath)));
OutputStream os=new FileOutputStream(pdfPath);
PdfWriter.getInstance(document, os);
document.open();
String cache=null;
while((cache=reader.readLine())!=null){
document.add(new Paragraph(cache, FontChinese));
}
} catch (DocumentException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
}finally{
document.close();
}
}
}
上面程式碼中的兩個方法就是文字文件轉為pdf,然後pdf轉為文字文件的過程。其他型別的轉化和細節使用,
待以後繼續測試使用後再來分享經驗
相關文章
- CAD入門級練習題
- sql查詢入門練習題SQL
- 慕課網Python入門練習題---Python
- 入門MySQL——查詢語法練習MySql
- [MySQL光速入門]008 SQL強化練習MySql
- [MySQL光速入門]009 SQL強化練習答案MySql
- 編譯器背後的故事(入門練習)編譯
- Pytorch入門演練PyTorch
- java入門第三季6-5練習Java
- 遊戲關卡設計如何入門和練習?遊戲
- Python入門教程100天:Day05-練習總結Python
- JAVA入門第二季4-2練習Java
- Python入門必學,用Python練習畫個美隊盾牌Python
- 三次答題判題程式練習讓你入門Java。Java
- Shiro入門學習---使用自定義Realm完成認證|練氣中期
- JAVA入門第三季——最後練習題撲克牌Java
- Git從入門到熟練掌握Git
- go+vue入門專案練手GoVue
- deepspeed基礎入門 cifar的訓練
- Java入門第二季 6-1綜合練習程式碼Java
- ROS入門學習ROS
- nuxt 入門學習UX
- Nginx入門學習Nginx
- mybatis入門學習MyBatis
- Linux入門學習Linux
- GORM學習入門GoORM
- Vue入門學習Vue
- MyBatisPlus入門學習MyBatis
- spring入門學習Spring
- 藍橋杯:入門訓練 Fibonacci數列
- 分散式訓練從入門到放棄分散式
- shiro入門學習--使用MD5和salt進行加密|練氣後期加密
- 入門級Python練手專案,有哪些值得推薦?附學習圖譜Python
- Egg入門學習(一)
- leaflet學習一 入門
- Mybatis框架 入門學習MyBatis框架
- RPC學習入門(轉)RPC
- Nacos整合學習入門
- Nestjs入門學習教程JS