Tesseract-OCR -01-Tesseract 介紹

肖朋偉發表於2018-09-07

原文網址 : https://www.cnblogs.com/xpwi/p/9604304.html

Tesseract-OCR -01-Tesseract 介紹

OCR(Optical Character Recognition)：

光學字元識別,是指對圖片檔案中的文字進行分析識別，獲取的過程
Tesseract - OCR 引擎最先由HP實驗室於1985年開始研發，至1995年時已經成為OCR業內最準確的三款識別引擎之一。然而，HP不久便決定放棄OCR業務，Tesseract也從此塵封
數年以後，HP 意識到，與其將Tesseract束之高閣，不如貢獻給開源軟體業，讓其重煥新生
在2005年，Tesseract 由美國內華達州資訊科技研究所獲得，並求諸於 Google 對 Tesseract 進行改進、消除Bug、優化工作，Tesseract 由惠普公司宣佈開源
從2006年到現在，都由 Google 公司開發維護

Tesseract - OCR 特性

目前，Tesseract可以識別超過100種語言。也可以用來訓練其它的語言
原始碼包提供了一個OCR的引擎——libtesseract 以及一個命令列程式——tesseract.exe
Tesseract 支援多種輸出格式，如：普通文字、html、pdf 等

對於開發者

開發者可以使用libtesseract的C/C++介面來構建自己的程式
Tesseract從原始碼生成的文件可以在tesseract-ocr.github.io中找到

我的 Tesseract 隨筆

本筆記不允許任何個人和組織轉載

相關文章

介紹
2024-10-05
Proxy介紹
2019-02-16
Reflect介紹
2019-02-16
Azkaban介紹
2019-01-25
模式介紹
2018-12-23
模式
ZooKeeper介紹
2018-08-21
css介紹
2018-06-26
CSS
PostgreSQLHooK介紹
2018-06-29
SQLHook
DuelJS 介紹
2018-06-15
JS
Docker介紹
2024-03-29
Docker
StarRocks 介紹
2024-02-15
JCache 介紹
2024-03-17
zigbee 介紹
2024-04-10
GO 介紹
2024-04-01
Go
RPC介紹
2024-03-19
RPC
springcloud介紹
2019-08-15
SpringGCCloud
CSRedisCore 介紹
2019-09-23
Redis
AJAX 介紹
2019-07-23
php介紹
2020-03-18
PHP
Pyzmq介紹
2020-09-02
MQ
uniswap介紹
2020-10-09
LDAP 介紹
2020-09-29
LDA
rustyline 介紹
2020-07-10
Rust
SpringBoot介紹
2019-06-08
Spring Boot
JSON 介紹
2019-07-11
JSON
BitMap介紹
2019-01-28
Yocto 介紹
2024-10-23
自我介紹
2024-10-10
git介紹
2024-10-03
Git
FontFamily介紹
2024-11-14
Dubbo介紹
2024-11-07
Duktape 介紹
2024-08-25
jsoncpp 介紹
2024-08-19
JSON
公文介紹
2024-08-23
MySql介紹
2024-08-16
MySql
Ceph介紹
2024-08-09
Ninja介紹
2024-09-17
weex介紹
2018-04-25