外掛級OCR神器:免費文件解析、表格識別、手寫識別、古籍識別、PDF轉Word

techlead_krischang發表於2024-07-05

TextIn Tools是一款免費的線上OCR工具,支援快速準確的文字和表格識別,手寫、古籍識別,提供PDF轉Markdown大模型輔助工具,同時支援PDF、WORD、EXCEL、JPG、PPT等各類格式檔案的轉化。

file

TextIn Tools特點

  • 免費:所有產品提供每日200頁免費額度,覆蓋日常使用需求。
  • 方便:無需下載安裝,PC端線上即用。
  • 高效:不必等待,最快1.5s內解析100頁長文件。
  • 準確:解析穩定,避免亂碼。
  • 能力:文字識別、表格識別、文件解析、各類格式轉換。

1. 智慧文件解析:大模型友好的文件解析工具

PDF轉Markdown

支援將任意格式的檔案(圖片、PDF、Doc/Docx、網頁等)解析為Markdown或Json格式,以對LLM友好的方式呈現。

  • 更高速度:100頁PDF最快1.5s完成解析
  • 更大檔案:目前同步介面支援檔案最大可達500MB
  • 更長檔案:支援最長1000頁

file
選擇工具,點選PDF轉Markdown

file
點選/拖拽上傳檔案,等待線上轉換

file
點選下載markdown檔案

下面我們進行一個簡單的測試。
首先,在國內某通用大模型問答C端產品上傳一份PDF版企業年報,並提出金融分析領域的常見問題:請介紹公司的資產結構。
大模型給出了多個方面的介紹,但答案籠統,資料資訊較為粗略。
我們嘗試替換文件解析工具,將PDF檔案上傳至TextIn平臺進行解析,並把解析後的Markdown檔案上傳,向大模型提出同一個問題。此次,大模型給出了貨幣資金、長期股權投資等資料資訊。

file
file

我們回到年報原文件進行驗證,以排除幻覺干擾。在以下表格中可以看到,在改變解析工具後,大模型的回答來自於年報中表格資料,資訊準確。
file

在這一類案例中,文件解析工具效能對問答類產品表現的影響顯著可見。

應用場景

大模型問答
支援解析各型別的知識庫內容,包括企業內部的文件庫和公開的文章報告。透過將解析內容提供給問答系統,讓大模型在合成答案時言之有物,從而減少幻覺的產生,提升問答質量。
大模型訓練語料處理
識別並還原各類文件中的內容,並以markdown序列的格式進行輸出,適配生成式語言模型的訓練。高質量的文件解析結果,也能減少人工糾錯資料的時間,從而加快模型訓練的整體節奏。
文件翻譯
透過文件內容解析,完成原始資訊的提取,以下游機器翻譯任務友好的方式還原文件內容,從而加快翻譯任務的執行。

2. 通用文字識別

表格+手寫識別

支援對各種版式影像中的多方向文字、表格文字等進行提取和識別,同時支援文件版面分析與還原。解決影像模糊、歪斜、反光、形變、光照不均、陰影、低畫素、背景複雜、字型複雜、多語言融合等複雜場景的識別問題。

  • 中文印刷體平均字元識別準確率99.7%
  • 識別引擎支援50+主流語言

file
點選手寫識別
file
點選/拖拽上傳檔案
file
file
手寫表格識別效果:手寫文字完全準確、合併單元格精準識別

應用場景

內容稽核與管理
識別影像中的不良文字,如社交和電商等應用中的不文明內容,提示相應風險,協助使用者進行稽核處理,幫助使用者有效規避業務風險,及時發現違規行為,大大降低人力成本,廣泛應用於電商內容治理場景
隨手拍掃描
支援快速識別路標、指示牌、廣告牌、街邊店鋪招牌、商品包裝、購物小票等生活場景中的實體文字資訊,應用於地圖、翻譯、搜尋、生活出行等移動應用中,方便使用者進行文字的提取或錄入,有效提升產品易用性和使用者使用體驗。
古籍識別
利用光學字元識別技術(簡稱OCR),可以識別古籍中的內容、文字,分析版面並進行結構化輸出,這對於複雜版式的古籍保護(比如族譜、地方誌等)、檢索,乃至資訊挖掘和知識發現,都有非常重大的意義。
file
file
點選/拖拽上傳檔案
file
古籍識別效果:文字識別準確率高,還原語序

3. 文件格式轉換

提供PDF/Word/Excel/PPT及圖片多種格式的高精度轉換,高保真輸出,並支援自定義水印等功能,提升檔案處理效率。可用於教育檔案處理、辦公文件處理等場景。

  • 服務安全穩定:TextIn提供服務可靠、安全、穩定的格式轉換服務,具備ISO認證和等保認證,服務可用性高於99%。
  • 具備多種自定義功能:可實現自定義水印、zip包加密等功能,根據場景進行個性化定製。
    file
    file
    點選/拖拽上傳檔案
    file
    file
    PDF轉Word效果展示

歡迎大家體驗試用:https://cc.co/16YSIx

目前,TextIn Tools支援線上試用,如在使用過程中遇到問題,可在官網掃描二維碼加入使用者社群,會有專人一對一解答您的問題,也歡迎與TextIn團隊進行技術交流,提出寶貴的意見或建議。
TextIn文件解析目前正處於內測階段,內測期間,為每位開發者提供每週7000頁的額度福利,新增下方企微後即可領取!

如有幫助,請多關注
TeahLead KrisChang,10+年的網際網路和人工智慧從業經驗,10年+技術和業務團隊管理經驗,同濟軟體工程本科,復旦工程管理碩士,阿里雲認證雲服務資深架構師,上億營收AI產品業務負責人。

相關文章