OCR演算法識別率怎麼評估?

測試狗一枚發表於2020-12-11

關於OCR演算法:http://ocr.space/

ocr api介面的種類:OCR名片識別API介面、OCR文件識別API介面、OCR車牌識別API介面、OCR證件識別API介面

一、測試方法:

人工檢驗(效率低、需要提升)

二、演算法指標:

1、文字識別準確率

字元準確率:單字識別率,就是按單字算,一百個字裡錯5個字,識別率95%。

  • 字元識別準確率,即識別對的字元數佔總識別出來字元數的比例,可以反應識別錯和多識別的情況,但無法反應漏識別的情況
  • 字元識別召回率,即識別對的字元數佔實際字元數的比例,可以反應識別錯和漏識別的情況,但是沒辦法反應多識別的情況,可以配套字元識別準確率一起使用。

整行準確率:一個欄位算一個整體,假如100個字分為20個欄位,裡面錯了5個字,分佈在4個欄位裡,那麼識別率是16/20=80%。

  • 平均編輯距離:平均編輯距離越小說明識別率越高。平均編輯距離主要衡量整行或整篇文章的指標,可以同時反應識別錯,漏識別和多識別的情況
  • 文字行定位為的準確率和召回率,同字元識別的準確率和召回率。主要反應文字行定位的指標,是ocr演算法的重要指標

三、圖片準備

圖片覆蓋範圍:

不同字型(單字型、混合字型、不同語言的字型)

不同語言(單語言、混合語言、混合特殊字元、公式等)

橫排文字、豎排文字

不同圖片格式

複雜排版、圖文混排、插圖中的文字、不同清晰度

相關文章