Exploring Font-independent Features for Scene Text Recognition (ACM2020)研究場景文字中與字型無關的特徵

BugLess++發表於2020-09-25

0. 引言

1. 摘要

近年來,場景文字識別(STR)已得到了廣泛的研究。許多最近提出的方法都是經過專門設計的,以適應場景文字的任意形狀,佈局和方向,但是忽略了各種字型(或書寫)樣式也給STR帶來了嚴峻挑戰。這些方法(使字元的字型特徵和內容特徵糾纏在一起)在具有新穎字型樣式的文字的場景影像上的文字識別中表現不佳。為了解決這個問題,我們通過注意生成大量字型樣式的字形來探索場景文字的字型無關特徵。具體來說,我們引入可訓練的字型嵌入來塑造生成的字形的字型樣式,場景文字的影像特徵僅代表其基本模式。生成過程以空間注意機制為指導,有效地處理不規則文字,生成比現有影像到影像翻譯方法更高質量的字形。在幾個STR基準測試上進行的實驗表明,與現有技術相比,我們的方法具有優越性。

2. 動機

3. 創新點

4. 主要框架

5. 實驗

6. 總結

相關文章