OCR演算法識別率怎麼評估?
關於OCR演算法:http://ocr.space/
ocr api介面的種類:OCR名片識別API介面、OCR文件識別API介面、OCR車牌識別API介面、OCR證件識別API介面
一、測試方法:
人工檢驗(效率低、需要提升)
二、演算法指標:
1、文字識別準確率
字元準確率:單字識別率,就是按單字算,一百個字裡錯5個字,識別率95%。
- 字元識別準確率,即識別對的字元數佔總識別出來字元數的比例,可以反應識別錯和多識別的情況,但無法反應漏識別的情況
- 字元識別召回率,即識別對的字元數佔實際字元數的比例,可以反應識別錯和漏識別的情況,但是沒辦法反應多識別的情況,可以配套字元識別準確率一起使用。
整行準確率:一個欄位算一個整體,假如100個字分為20個欄位,裡面錯了5個字,分佈在4個欄位裡,那麼識別率是16/20=80%。
- 平均編輯距離:平均編輯距離越小說明識別率越高。平均編輯距離主要衡量整行或整篇文章的指標,可以同時反應識別錯,漏識別和多識別的情況
- 文字行定位為的準確率和召回率,同字元識別的準確率和召回率。主要反應文字行定位的指標,是ocr演算法的重要指標
三、圖片準備
圖片覆蓋範圍:
不同字型(單字型、混合字型、不同語言的字型)
不同語言(單語言、混合語言、混合特殊字元、公式等)
橫排文字、豎排文字
不同圖片格式
複雜排版、圖文混排、插圖中的文字、不同清晰度
相關文章
- ocr文字識別軟體怎麼識別手機上的照片文字?
- OCR識別技術
- Tesseract Ocr文字識別
- 看懂身份證識別OCR:從演算法到 API 使用演算法API
- ocr文字識別技術
- OCR識別技術—財務報表識別
- OCR識別技術—增值稅發票識別
- OCR表單識別/雲脈通用表單識別/表格識別
- 模型評估過程中:命中率/覆蓋率模型
- 手機OCR證件識別
- OCR技術-文字影像識別
- OCR身份證識別技術
- Tesseract OCR 圖片文字識別
- 文字識別(OCR)介紹與免費開源專案使用測評
- 360評估參評人胡亂打分攪局怎麼辦?
- 360評估參評人拉幫結派搞小圈子給別人惡意評低分怎麼辦?
- OCR識別技術—財務報表識別(2)
- 語音識別 (ASR) 模型測試 之 評估指標探索模型指標
- 怎麼把圖片掃描成文字?轉易俠OCR文字識別軟體
- OCR檢測與識別技術
- 文通科技OCR證件識別|
- 中安OCR文字識別系統
- 最好用的OCR識別軟體
- TH-OCR文字識別技術
- Text Scanner for Mac ocr文字識別工具Mac
- OCRKit Pro for mac (OCR文字識別工具)Mac
- OCR文字識別工具:OCRKit Pro中文
- OCR文字識別工具:OCRKit Pro macMac
- golang 通過docker 搭建 ocr識別GolangDocker
- 文件掃描OCR識別-1(python)Python
- 手寫的文字圖片怎樣使用OCR軟體識別?
- 看懂二維碼識別OCR:從演算法到API 接入程式碼演算法API
- 文字識別解決方案-OCR識別應用場景解析
- 如何精準實現OCR文字識別?
- opencv圖片處理與OCR識別OpenCV
- OCR識別技術—活體檢測
- OCR識別的技術流程解析1
- OCR識別的技術流程解析2