由百度聯合馬來亞大學、華南理工大學、西班牙巴塞羅那自治大學-計算機視覺中心、中國圖象圖形學會主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標註大規模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字)國際權威競賽任務於5月圓滿結束。此次競賽共吸引來自業界頂尖技術團隊、高校及科研機構共118支團隊參賽,有效提交結果總計339個。經過兩個月的激烈角逐,ICDAR 2019-ArT競賽五項子任務的冠軍分別由中科院(文字檢測)、曠視(Latin文字識別)、韓國NAVER(Latin中文混合文字識別)、北京航空航天大學(Latin文字、Latin中文混合端到端文字識別)獲得,ICDAR 2019-LSVT競賽文字檢測和端到端文字識別兩項任務冠軍由騰訊DPPR團隊獲得。
精英薈聚ICDAR2019 桂冠引群雄爭奪
ICDAR“Robust Reading Competitions”競賽是評估自然場景/網路圖片/複雜影片文字提取與智慧識別新技術進展的權威國際賽事及評測標準,競賽中湧現出諸多方法持續推動業界新技術的創新與應用。在ICDAR2019百度釋出的兩項極具挑戰的競賽任務中, ICDAR 2019-LSVT競賽資料包括5萬張精標註街景影像、40萬張弱標註街景影像,聚焦探索大規模資料場景下深度學習文字識別能力極限。ICDAR2019-ArT競賽資料總計10176張,是業界最大的任意形狀場景文字集合,聚焦推動自然場景下任意形狀文字檢測識別能力新突破。
各工業界與學術界頂尖團隊充分發揮各自技術優勢,針對競賽任務不斷最佳化創新方案與演算法效果,經過激烈角逐的比賽結果展現出大規模街景文字識別深度學習、任意形狀文字檢測與識別技術新高度。百度聯合學術界將持續對該競賽集合及榜單進行維護,為推進相關視覺AI技術領域不斷髮展貢獻力量。
百度OCR實力強勁多場景應用實踐豐富
此次ICDAR 2019國際競賽任務推動了大規模街景深度學習文字識別及任意形狀文字識別方向的發展,是一場學術交流與技術碰撞的盛宴。而在ICDAR 2019國際競賽中,百度OCR承擔競賽組織者角色,這也進一步加強了百度的國際影響力。
百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權威集合檢測、識別、端到端各項任務榜單第一,處於業內領先水平。近兩年來,百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會議上發表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力於解決影片OCR檢測問題,將影片文字檢測和線上跟蹤任務高效整合到統一、可訓練的網路框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結構化資訊提取方法,同時公開了結構化資訊提取領域的大型資料集合。
百度不僅致力於OCR技術領域的縱深研究,同時也是“領先且實用AI視覺技術”的堅定實踐者。多年實踐經驗積累形成了豐富的百度OCR產品矩陣。通用系列文字識別能力不僅能高精度的識別文字,還支援中、英、日、韓、法等十國語言的識別以及置信度、位置等資訊的返回;卡證識別能力不僅支援對身份證、銀行卡、護照、名片等常見卡證的識別,還支援卡證採集、分類、屬性判斷等能力;票據識別能力不僅支援財務場景全品類識別,還支援金融、醫療等場景票據識別;針對終端文字識別場景,百度領先的模型壓縮技術應用於所有OCR終端產品,OCR終端SDK與多家手機廠商達成合作,將識字能力賦予手機。目前,百度OCR產品能力已超50項,在各行業實現了諸多技術突破與產品落地,覆蓋了財務、銀行、醫療、政法、教育、交通、電商、快遞等場景。
未來,百度會與各企業持續探索OCR的落地可能性,讓OCR賦能更多企業,同時也將持續秉持普惠的價值理念,在產業實踐中不斷打磨,持續賦能服務客戶,持續打造領先且實用的AI技術,用科技的力量讓複雜的世界更簡單。
更多競賽詳情請見官網:
ICDAR 2019-LSVT:http://rrc.cvc.uab.es/?ch=16
ICDAR 2019-ArT:http://rrc.cvc.uab.es/?ch=14