iText 是一款從圖片中識別文字的工具,解決了諸如掃描版 PDF 無法複製等問題。在保持簡潔的同時,我也在不斷 改進 iText 的功能和便利性。新年第一版,來看看有哪些變化吧。
識別文字後自動翻譯
使用場景:比如,對於英文版的 PDF、未翻譯的字幕、未漢化的遊戲,直接用 iText 截圖,自動翻譯為中文。
iText 整合 Google、百度雙引擎:優先選用 Google,當無法訪問 Google 時使用百度。
注:為保持程式的簡潔,翻譯功能預設是關閉的。可以在識別結果視窗點選翻譯按鈕、或按下 ⌘T
快捷鍵,即可快速開啟翻譯。一旦開啟,後續的識別也會自動翻譯,直至手動關閉。
關於體驗的一點思考
做產品的,都要講使用者體驗,這裡我也提一點細節:Google 翻譯支援 100+ 種語言。那麼,如果在列表中展示這 100+ 種語言呢?
- 最簡單粗暴,直接把語言列出來
- 進一步,對語言進行排序,方便查詢
- 排序,又會涉及到本地化排序。比如,對於漢字,一般是按拼音排序
- 進一步,一般而言,我們是要翻譯為自己的母語
- 比如我們國人,多數是要翻譯為中文
- 於是,可以單獨列出和 macOS 系統相匹配的語言列表,預設選擇最優先的語言
- 上面描述的是預設的選擇,還得考慮使用者切換翻譯語言後的動態更新
- 通常,我們不太會同時掌握很多外語,要翻譯的也只是少量語言。因此,iText 會保留使用者最近手動選擇的 3 種語言
於是,iText 的語言列表是這樣的:
其實,沿著這個思路,還有很多事可以做。比如: 如果從圖片中識別出的語言是英文,翻譯的目標語言自然不應該是英文,那就應該設定成什麼呢?等等,諸如此類的問題,可以繼續優化下去。對體驗的追求,是無止境的。
支援連續識別
使用場景:比如,對於雙欄等排版複雜的圖片,如果一次性識別,識別結果可能會有諸多雜音,效果不夠理想。而如果分塊擷取對應區域,排版效果則會好很多。而 iText 可以在連線識別的模式下,自動拼接識別後的文字,很方便。
注:和翻譯功能類似,此功能預設關閉。需要時,可以點選識別視窗底部的按鈕開啟。
下載
每月可免費識別 20 次,訂閱 iText 高階版即可無限次識別、無限次翻譯。
這裡主要介紹了 iText 新版的變化。如需瞭解更多,可以參考:
- 之前的文章:有了 iText:你截圖,騰訊 OCR 幫你識別文字
- 瞧瞧 iText 使用教程
如果你覺得 iText 還不錯,還請幫忙 在 App Store 評論;如果你覺得 iText 還可以改進,歡迎:
- 加入 Telegram 群
- 微信掃碼入群: