有了 iText，你截圖，騰訊、Google OCR 幫你識別文字

atJason發表於2017-11-30

比如，在看類似上面的掃描版 PDF 時，想要複製其中的文字，怎麼辦？手打？太累。試試我新開發的工具 iText 吧。

iText 是 macOS 平臺的 OCR 工具，自帶截圖功能，選擇螢幕任意區域，即可識別其中的文字，又爽又酷。

識別後的文字已經複製到系統剪貼簿，直接貼上即可。

配合 ⇧⌘1 快捷鍵，使用體驗更佳。當然，你也可以選擇圖片檔案，或者將圖片拖拽至 iText 的選單欄圖示進行識別。

文字識別精準

你有沒有這種印象：OCR 識別出來的文字有很多問題，還不如自己打字來得快。可見，識別的準確性非常重要，也是我非常在意的一點。

騰訊、Google 雙引擎

首先，我排除了離線的識別庫，因為離線註定了這些庫的識別能力是死的，不會自己增強。接下來，在一票線上 OCR 服務中，我對比了百度、騰訊、微軟、Google 等大廠的產品，最後選擇了國內使用騰訊、國外使用 Google 的組合。判斷依據是什麼？少量測試 + 主觀傾向，比如不測我就覺得 Google 比微軟牛。

那麼，到底識別準不準呢？這麼說吧：

對於一般的自然語言，比如書中的一段話、新聞稿，識別效果是驚人的準確，甚至可以達到 100%
對於排版複雜、尤其有特殊字元的文字，比如程式程式碼、選擇題，識別效果就不太理想，需要手動對識別後的結果進行修正
- 比如，單純地給一個豎線，機器是無法區分到底是小寫的 l、還是大寫的 I（順便問一下，你看出二者的區別了嗎？）；與之相對，機器是需要根據上下文進行判斷和優化的。而像程式程式碼這種非自然語言，機器目前是很難進行語義識別的

到底準不準？你不妨一試。

獨創演算法，進一步優化識別結果

OCR 服務還有一些欠缺，iText 針對性地做了這些優化：

自動識別段落
中文環境使用全形標點符號
中文與英文字母、數字間增加空格
刪除中文字元間、英文字元與標點符號間的多餘空格
英文首字母大寫

如果你發現識別不好的地方，歡迎把圖發給我，我會相應地優化演算法，畢竟演算法是需要資料餵養的，先謝。

預覽原圖，方便校對

在目前 OCR 技術不能始終達到 100% 的情況下，預覽原圖、並進行修正，還是有必要的。在 iText 中，你可以這樣：

將識別後的視窗拖到圖片附近
呼叫 iText 識別結果的 雙欄模式：左側展示圖片、右側展示識別後的文字

這樣，就可以很方便地對照原圖進行手動優化識別後的文字。

下載與付費

其實，很多場景都會用到 iText，比如 識別快遞單上的號碼、圖片中的聯絡人資訊、需要登入才能複製的網頁 等等，歡迎下載 iText 試試。

每月可免費識別 20 次，訂閱 iText 高階版即可無限次識別。首發期間，高階版限時 6 折優惠：￥3/月、￥30/年。關於收費模式，我很是糾結了一番。如果你準備吐槽，請先看下這篇文章：再次糾結付費模式，這次是 iText

如果你覺得 iText 還不錯，還請幫忙在 App Store 評論；如果你覺得 iText 還可以改進，歡迎：

在這裡留言
加入 Telegram 群
微信加沾入群：it_guwen

相關文章

mac上OCR截圖文字識別工具:iText for mac
2021-12-07
Mac
?白piao？iText 1.7.4 中文版 (OCR圖片文字識別工具)
2020-12-09
iText for MacOCR識別圖中文字工具
2021-02-03
Mac
圖片識別文字，分享給你！
2022-03-15
OCR識別圖中文字工具：iText for mac v1.7.7中文啟用版
2023-11-28
Mac
你要的全拿走-ocr文字識別智慧化解決方案
2020-02-21
文件太多彆著急，OCR識別工具幫你一鍵搞定！
2019-12-09
開源ocr 識別手機截圖定位
2024-03-15
iText 新年新版：截圖識別文字後，翻譯為 100+ 種語言
2018-01-02
推薦丨工具-電腦一鍵截圖+OCR文字識別工具--天若OCR（windows系統）
2018-11-03
Windows
ocr文字識別技術
2019-12-30
如何將截圖快速識別成文字？
2024-05-14
有道自然語言翻譯和文字識別OCR(圖片文字識別)介面呼叫
2019-04-04
Java如何使用Tessdata做OCR圖片文字識別
2021-07-28
Java
OCR圖片文字識別軟體：Initiater Pro for Mac
2024-01-11
Mac
Java 實現OCR掃描/識別圖片文字
2024-04-01
Java
OCR技術-文字影像識別
2019-11-05
中安OCR文字識別系統
2020-02-06
TH-OCR文字識別技術
2019-11-19
Text Scanner for Mac ocr文字識別工具
2021-08-22
Mac
OCR文字識別工具：OCRKit Pro中文
2022-10-20
OCRKit Pro for mac (OCR文字識別工具)
2021-11-12
Mac
OCR文字識別工具:OCRKit Pro mac
2022-03-09
Mac
ocr文字識別軟體怎麼識別手機上的照片文字？
2022-01-05
OCR文字識TextMan別幫您解決網頁、影像中不能複製文字的問題
2022-07-20
網頁
你網購遭遇釣魚了嗎？瑞星安全隨身WiFi率先幫你攔截
2017-11-08
WiFi
OCR文字識別軟體線上如何操作？
2019-07-23
如何精準實現OCR文字識別？
2018-10-25
Python呼叫百度OCR介面圖片識別轉文字
2022-04-23
Python
手寫的文字圖片怎樣使用OCR軟體識別？
2021-09-09
JavaScript圖片文字識別（OCR）外掛Ocrad.js教程
2018-12-05
JavaScriptJS
excel表格文字識別-ocr表格文字提取api介面整合
2024-10-31
ExcelAPI
安裝LaTeX-OCR截圖識別轉換成LaTeX-Markdown格式
2024-11-03
孩子要學Python了，別慌，它們或對你有幫助
2020-08-10
Python
怎麼把圖片掃描成文字？轉易俠OCR文字識別軟體
2021-12-28
文字識別解決方案-OCR識別應用場景解析
2024-10-15
Python3呼叫百度OCR圖片文字識別API
2020-08-20
PythonAPI
Text Scanner 1.2.6 超好用的OCR文件掃描截圖識別翻譯工具
2020-09-26