Exploring Font-independent Features for Scene Text Recognition (ACM2020)研究場景文字中與字型無關的特徵
0. 引言
1. 摘要
近年來,場景文字識別(STR)已得到了廣泛的研究。許多最近提出的方法都是經過專門設計的,以適應場景文字的任意形狀,佈局和方向,但是忽略了各種字型(或書寫)樣式也給STR帶來了嚴峻挑戰。這些方法(使字元的字型特徵和內容特徵糾纏在一起)在具有新穎字型樣式的文字的場景影像上的文字識別中表現不佳。為了解決這個問題,我們通過注意生成大量字型樣式的字形來探索場景文字的字型無關特徵。具體來說,我們引入可訓練的字型嵌入來塑造生成的字形的字型樣式,場景文字的影像特徵僅代表其基本模式。生成過程以空間注意機制為指導,有效地處理不規則文字,生成比現有影像到影像翻譯方法更高質量的字形。在幾個STR基準測試上進行的實驗表明,與現有技術相比,我們的方法具有優越性。
2. 動機
3. 創新點
4. 主要框架
5. 實驗
6. 總結
相關文章
- 基於深度學習的場景文字檢測和識別(Scene Text Detection and Recognition)綜述深度學習
- [SceneKit專題]6-Scene-Editor場景編輯器
- 白翔:複雜開放場景中的文字理解
- 微信小程式的所有scene場景值 2020-10-21微信小程式
- 場景在關卡設計中的比重
- 文字挖掘和文字分析的九大應用場景
- 筆記:harvesting discriminative meta objects with deep CNN features for scene classification筆記ObjectCNN
- html中中文字型的程式碼HTML
- tkinter中text文字與scroll滾動條控制元件(五)控制元件
- Java中關於OOM的場景及解決方法JavaOOM
- 行高與字型的關係
- Static and Animated 3D Scene Generation from Free-form Text Descriptions3DORM
- 關於iOS中的執行緒安全和使用場景iOS執行緒
- Java中關於OOM的場景及解決方法(轉)JavaOOM
- SOA 案例研究:Web 2.0 SOA 場景Web
- Redis 中 BitMap 的使用場景Redis
- 海量短文字場景下的去重演算法演算法
- CTPN/CRNN的OCR自然場景文字識別理解(一)RNN
- SVG <text>繪製文字SVG
- Flink 在風控場景實時特徵落地實戰特徵
- BFC的概念與應用場景
- mysql與redis的區別與使用場景MySqlRedis
- Linux中文字型的轉換與內嵌(轉)Linux
- 遊戲場景中的光影設計遊戲
- Unity製作遊戲中的場景Unity遊戲
- CSS 文字裝飾 text-decoration & text-emphasisCSS
- iOS中的轉場研究(3)iOS
- iOS中的轉場研究(1)iOS
- 中獎與抽獎次序無關
- B-index、bitmap-index、text-index使用場景詳解Index
- 通用文字識別API-通用文字識別介面可以識別哪些場景文字API
- 關於推薦系統中的特徵工程特徵工程
- CSS從入門到精通——文字與字型樣式CSS
- 遊戲場景構成研究:圖形構成遊戲
- SOA 案例研究:安全性和管理場景
- 淺談二次元場景特徵和繪製手法二次元特徵
- 阿里提出IncepText:全新多向場景文字檢測模組阿里
- CSS匹配input text文字框CSS