NAVER提出字元級別的文字檢測網路：CRAFT

CVer發表於2019-05-15

字元Raft

Character Region Awareness for Text Detection
KeyWords Plus: CVPR2019 Curved Text

paper ：https://arxiv.org/abs/1904.01941

NAVER：line的母公司，韓國的最大的網際網路公司，字元級別的文字檢測，採用了CAM熱力圖的操作去檢測每一個字元

Introduction

字元級別的文字檢測網路，用的是分水嶺演算法生成label，採用heatmaps去得到啟用值最大的目標區域，有點attention的感覺。

1、論文創新點

1.提出了一篇字元級別的檢測演算法
2.預測得到 :1.The character region score 2. Affinity score. The region score is used to localize individual characters in the image, and the affinity score is used to group each character into a single instance.
3.Propose a weakly- supervised learning framework that estimates character- level ground truths in existing real word-level datasets.

2、演算法主體

改論文主要預測每個字元區域和字元之間的一個緊密程度預測，因為沒有字元級別的label，所以模型訓練在一個弱監督的方式下。網路的backbone採用VGG16，之後接上取樣最終輸出兩個通道：the region score and the affinity score

訓練在一個弱監督學習的方式下，有人造合成的資料集具有字元級別的label，real image沒有字元級別的標註時，自己檢測合成產生label再進行訓練。如上圖所示，對真實場景中的資料集和人造合成的資料集有不同的訓練方式。

3、label generation

分別產生Region Score GT和Affinity Score GT

the following steps to approximate and generate the ground truth for both the region score and the affinity score:

1) prepare a2-dimensional isotropic Gaussian map;

2) compute perspective transformbetween the Gaussian map region and each character box;

3) warp Gaussian mapto the box area.

使用小感受野也能預測大文字和長文字，只需要關注字元級別的內容而不需要關注整個文字例項。

三步產生字元級別的label：
1、摳出文字級別的內容
2、預測region score區域
3、運用分水嶺演算法
4、得到字元基本的文字框
5、貼上文字框

為了防止在弱監督方式下產生的錯誤label帶偏網路，該論文提出了一個評價方式（雖然我沒有咋看明白），大概就是計算一個

4、Post-processing

正常文字後處理分為以下幾步：

1、首先對0-1之間的概率圖進行取閾值計算
2、使用Connected Component Labeling(CCL) 進行區域連線
3、最後使用opencv的MinAreaRect去框出最小的四邊形區域

不規則文字檢測後處理分為以下幾步（如上圖所示）：

1、先找到掃描方向的區域性最大值（blue line）
2、連線所有the local maxima上的中心點叫做中心線
3、然後將the local maxima lines旋轉至於中心線垂直
4、the local maxima lines上的端點是文字控制點的候選點，為了能更好的覆蓋文字，將文字最外端的兩個控制點分別向外移動the local maxima lines的半徑長度最為最終的控制點。

5、Experiment Results

6、Conclusion and Future work

個人觀點：不太受感受野的限制，只關注單個文字，對於長文字和不規則文字不必特意去設定相應大小的卷積提升感受野。

反饋與建議

郵箱：<weij ia_wu@yeah.net>

曠視科技提出新型端到端可訓練網路Mask TextSpotter：可檢測和識別任意形狀的文字
2018-09-04
阿里提出IncepText：全新多向場景文字檢測模組
2018-05-07
阿里
文字檢測與識別資源
2018-03-15
曠視科技提出TextSnake：一個檢測任意形狀文字的靈活表徵
2018-09-07
GNNets：自然場景下文字檢測的幾何歸一化網路 | ICCV 2019
2019-12-16
GNN
文字識別——檢測部分 CTPN論文翻譯
2018-09-13
JS 檢測網路頻寬
2018-07-17
JS
檢測網路狀態 - flutter
2020-12-29
Flutter
文字識別（二）--字元識別技術總覽
2019-02-18
字元
網路狀態檢測的利器 - ss命令
2020-10-21
文字識別（五）--自然場景文字檢測技術綜述（CTPN, SegLink, EAST）
2019-02-18
AST
文字中的特殊字元
2024-07-07
字元
網際網路+檢驗檢測智慧化成發展趨勢
2021-02-26
Mountain Craft
2024-10-11
AIRaft
ECCV 2024｜牛津大學&港科提出毫秒級文生圖安全檢測框架Latent Guard
2024-11-05
框架
網路安全級別劃分為幾個等級?網路安全入門
2021-07-12
哪裡可以查到網路安全等級測評與檢測評估機構目錄？
2022-02-21
網際網路訪問檢測伺服器
2024-11-04
伺服器
文字檢測預處理地址
2018-10-10
OCR 文字檢測（Differentiable Binarization --- DB）
2023-05-10
網路安全級別劃分為幾個等級?網路安全基礎教程
2021-07-15
Chardet: 通用字元編碼檢測器
2024-05-21
字元
【網路安全】6款常見的Webshell檢測工具！
2022-11-10
Webshell
商湯ICCV論文解讀：自然場景下文字檢測的幾何歸一化網路（GNNets）
2019-12-17
GNN
短文字分類，騰訊AI Lab聯合港中文提出主題記憶網路
2018-10-23
文字分類AI
Goalng使用ping命令檢測網路是否連通，分析網路故障
2019-09-19
Go
目標檢測網路之 YOLOv3
2018-10-17
YOLO
iOS 12+ 中檢測網路訪問
2019-01-16
iOS
網路安全筆記-入侵檢測系統
2022-04-18
筆記
grafana 網路丟包率檢測設定
2021-02-09
Grafana
從影像中檢測和識別表格，北航&微軟提出新型資料集TableBank
2019-03-21
微軟
JavaScript安全的型別檢測
2018-08-08
JavaScript型別
CVPR 2019 | 告別低解析度網路，微軟提出高解析度深度神經網路HRNet
2019-05-22
微軟神經網路
網際網路安全大會提出“大安全”概念
2018-03-06
js 型別檢測
2019-04-13
JS型別
linux 網路 cat /proc/net/dev 檢視測試網路丟包情況
2024-04-23
Linuxdev
【CVPR2018】物體檢測中的結構推理網路
2018-07-29
使用基於 AI 的網路安全更快地檢測威脅
2022-10-11
AI

NAVER提出字元級別的文字檢測網路：CRAFT

2、演算法主體

3、label generation

4、Post-processing

5、Experiment Results

6、Conclusion and Future work

相關文章