java tess4j配置

Lee597發表於2024-08-16
ITesseract instance = new Tesseract();
try {
// 設定字型庫路徑
instance.setDatapath("/path/to/tessdata/");
// 新增特定的字型
instance.setLanguage("eng", "/path/to/font_folder");
// 設定DPI --> 正確的DPI設定能保證影像的質量和精度
instance.setTessVariable("user_defined_dpi", "300");
// 設定白名單
instance.setTessVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ");
// 設定黑名單
instance.setTessVariable("tessedit_char_blacklist", "0123456789");
// 設定頁面分割模式
instance.setTessVariable("tessedit_pageseg_mode", "6"); // 設定為1為單字模式,設定為6為佈局分析
// 塊級別的頁面分割
// instance.setPageSegMode(PageSegMode.PSM_BLOCK);
// 段落級別的頁面分割
// instance.setPageSegMode(PageSegMode.PSM_PARA);
// 文字行級別的頁面分割
// instance.setPageSegMode(PageSegMode.PSM_AUTO_OSD);
// 執行OCR
String result = instance.doOCR(new File("/path/to/image.png"));
System.out.println(result);
} catch (TesseractException e) {
e.printStackTrace();
}

相關文章