有了 iText,你截圖,騰訊、Google OCR 幫你識別文字

atJason發表於2017-11-30

比如,在看類似上面的掃描版 PDF 時,想要複製其中的文字,怎麼辦?手打?太累。試試我新開發的工具 iText 吧。

有了 iText,你截圖,騰訊、Google OCR 幫你識別文字

iText 是 macOS 平臺的 OCR 工具,自帶截圖功能,選擇螢幕任意區域,即可識別其中的文字,又爽又酷。

識別後的文字已經複製到系統剪貼簿,直接貼上即可。

配合 ⇧⌘1 快捷鍵,使用體驗更佳。當然,你也可以選擇圖片檔案,或者將圖片拖拽至 iText 的選單欄圖示進行識別。

文字識別精準

你有沒有這種印象:OCR 識別出來的文字有很多問題,還不如自己打字來得快。可見,識別的準確性非常重要,也是我非常在意的一點。

騰訊、Google 雙引擎

首先,我排除了離線的識別庫,因為離線註定了這些庫的識別能力是死的,不會自己增強。接下來,在一票線上 OCR 服務中,我對比了百度、騰訊、微軟、Google 等大廠的產品,最後選擇了國內使用騰訊、國外使用 Google 的組合。判斷依據是什麼?少量測試 + 主觀傾向,比如不測我就覺得 Google 比微軟牛。

那麼,到底識別準不準呢?這麼說吧:

  • 對於一般的自然語言,比如書中的一段話、新聞稿,識別效果是驚人的準確,甚至可以達到 100%
  • 對於排版複雜、尤其有特殊字元的文字,比如程式程式碼、選擇題,識別效果就不太理想,需要手動對識別後的結果進行修正
    • 比如,單純地給一個豎線,機器是無法區分到底是小寫的 l、還是大寫的 I(順便問一下,你看出二者的區別了嗎?);與之相對,機器是需要根據上下文進行判斷和優化的。而像程式程式碼這種非自然語言,機器目前是很難進行語義識別的

到底準不準?你不妨一試。

獨創演算法,進一步優化識別結果

OCR 服務還有一些欠缺,iText 針對性地做了這些優化:

  • 自動識別段落
  • 中文環境使用全形標點符號
  • 中文與英文字母、數字間增加空格
  • 刪除中文字元間、英文字元與標點符號間的多餘空格
  • 英文首字母大寫

如果你發現識別不好的地方,歡迎把圖發給我,我會相應地優化演算法,畢竟演算法是需要資料餵養的,先謝。

預覽原圖,方便校對

在目前 OCR 技術不能始終達到 100% 的情況下,預覽原圖、並進行修正,還是有必要的。在 iText 中,你可以這樣:

  • 將識別後的視窗拖到圖片附近
  • 呼叫 iText 識別結果的 雙欄模式:左側展示圖片、右側展示識別後的文字

這樣,就可以很方便地對照原圖進行手動優化識別後的文字。

下載與付費

其實,很多場景都會用到 iText,比如 識別快遞單上的號碼、圖片中的聯絡人資訊、需要登入才能複製的網頁 等等,歡迎下載 iText 試試。

每月可免費識別 20 次,訂閱 iText 高階版即可無限次識別。首發期間,高階版限時 6 折優惠:¥3/月、¥30/年。關於收費模式,我很是糾結了一番。如果你準備吐槽,請先看下這篇文章再次糾結付費模式,這次是 iText

如果你覺得 iText 還不錯,還請幫忙 在 App Store 評論;如果你覺得 iText 還可以改進,歡迎:

相關文章