美團作為全球最大的本地生活服務平臺,擁有由遍佈全國的市場人員所拍攝的眾多門臉招牌圖片資料。每張圖片都是由全國的不同個人,採用不同裝置,在不同地點,不同時間和不同環境下所拍攝的不同目標,是難得的可以公正評價演算法魯棒性和識別效果的圖片資料,挑戰也非常大。
近年來業界圍繞著文字檢測和文字識別提出了許多有效的演算法和技術方案。由於之前公開的資料集普遍以英文為主,因此所提出的技術方案對中文特有問題關注不足。表現在以中文為主的實際應用場景中,這些技術方案的結果與應用預期差距較大。以美團掌握的某典型中文圖片資料為例,在6000張圖的圖片資料集上(已去除文字無法辨識的圖片),測試了國內最知名的三個AI開放平臺,按欄位統計識別率分別是94%,91% 和 86%,經過努力我們也只達到 98%。中文OCR在實際應用場景的表現並不樂觀。
在此次 ICDAR2019上,我們挑選出很能代表中文特點的餐飲商家的門臉招牌圖片來組織競賽,這些招牌上的文字存在中文特有的設計和排版,同時也兼有自然場景文字識別中普遍存在的拍照角度、光照變化等干擾因素。我們希望通過競賽引起同行們對中文識別的關注,群策群力解決中文識別的實際問題。
會議與大賽介紹
國際文件分析與識別國際會議 (International Conference on Document Analysis and Recognition,ICDAR)是由國際模式識別學會(IAPR)組織的專業會議之一,專注於文字領域的識別與應用。ICDAR大會每兩年舉辦一次,目前已發展成文字識別領域的旗艦學術會議。為了提高自然場景的文字檢測和識別水平,國際文件分析和識別會議(ICDAR)於2003年設立了魯棒文字閱讀競賽(“Robust Reading Competitions”)。至今已有來自89個國家的3500多支隊伍參與。
ICDAR 2019將於今年9月20-25日在澳大利亞悉尼舉辦。 美團今年聯合國內外知名科研機構和學者,提出了"中文門臉招牌文字識別"比賽(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。
組織者
- 王棟、張睿、劉曦、周永生,美團
- 白翔、廖明輝、楊明錕,華中科技大學
- Baoguang Shi, Microsoft (Redmond,USA)
- Shijian Lu, Nanyang Technological University (Singapore)
- Dimosthenis Karatzas,Computer Vision Centre,UAB(Spain)
- C. V. Jawahar,IIIT Hyderabad(India)
資料集介紹
美團本次公開的資料,由遍佈全國的市場人員所拍攝的眾多門臉招牌圖片組成,共25000張。每張圖片是由完全獨立的不同個人,採用不同裝置,在不同地點,不同時間和不同環境下所拍攝的不同商家。該資料集以中文文字為主,也包含一定數量的英文和數字,英文和數字的佔比介於 10% 和 30% 之間。標註內容比較完備,每張圖片均標註了單個字元的位置和文字,以及各字串的位置和文字。是難得的用於研發和評估中文識別技術的資料集。其中,20000張圖片用於訓練,2000張用於驗證,3000張用於測試。
比賽內容
本次門臉招牌識別,共定義了 4 個任務,分別如下:
- TASK 1:招牌端到端文字識別
- TASK 2:招牌文字行定位
- TASK 3:招牌區域內單字識別
- TASK 4:招牌區域內字串識別
獎勵方式
頒發獎狀:按照最終成績進行排名,以從高至低順序依次選取前三名,頒發獎狀。 比賽獎金:從高至低順序選取前三名參賽方為學校及科研院所等非盈利機構。 獎金詳細如下:
重要日期
- 2019年3月1日:報名通道開放
- 2019年3月18日:訓練資料集開放
- 2019年4月15日:測試資料集分批開放
- 2019年4月16日:提交通道開放
- 2019年4月30日:提交截止日期
- 2019年5月10日:比賽最終報告提交
- 2019年9月20日:ICDAR 2019 大會召開
參賽報名
掃描下方二維碼,直接進入報名連結報名。
報名連結地址: http://rrc.cvc.uab.es/?ch=12 報名連結二維碼:
參賽答疑與交流
參賽答疑郵箱:mtdptech@meituan.com(郵件標題請註明 “ICDAR2019”) 加入參賽交流微信群
步驟1:微信新增 “MTDPtech02” 為好友(暱稱:美美),或掃描下方二維碼直接新增:
步驟2:回覆美美 “ICDAR2019”,則會自動將您加入ICDAR2019-ReCTS技術交流群