全球最大地標識別資料集問世:包含200萬張圖片和3萬處地標
安妮 編譯自 Google Research Blog
量子位 出品 | 公眾號 QbitAI
今天,谷歌推出了目前世界上最大的人造和自然地標識別資料集Google-Landmarks。資料集中包含200萬張圖片,描述了3萬處全球獨特地標,量級是普通的資料集的30倍。
△ 資料集中地標的位置分佈
兩場競賽
和這個資料集一同推出的,還有兩場相關的資料競賽:地標識別(Landmark Recognition)挑戰和地標檢索(Landmark Retrieval)挑戰。谷歌在部落格中表示,這將成為Kaggle競賽的賽題,也設有相應的獎金。
這場競賽的後續訊息,還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。
谷歌路標識別挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-recognition-challenge
谷歌路標檢索挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-retrieval-challenge
地標識別和其他問題比較大的區別在於,即使在一個大型標註過的資料集,對一個不太知名的地標也可能訓練得不夠。
此外,由於地標建築不會移動並且內部的變化非常小,因此,影像的拍攝條件,如遮擋、不同視角、天氣和光線等因素決定了地標影像的變化。但其他的普通資料集(比如萌犬資料集),往往變化多樣。
這兩個Kaggle挑戰提供了標註資料,幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試影像資料集中,讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中,參與者需要檢索包含相同地標的影像。
△ 資料集中部分地標建築
開源DELF
講到這裡還沒完。為了刺激這個領域的研究,谷歌研究人員還開源了專注本地特徵的描述符Deep Local Features(DELF)。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年,一個月前又進行了一次修改。
論文地址:
https://arxiv.org/abs/1612.06321
DELF開原始碼和資料集地址:
https://github.com/tensorflow/models/tree/master/research/delf
最後,附谷歌部落格介紹地址:
https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html
— 完 —
加入社群
量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot5,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 拆分PPOCRLabel標註的資料集並生成識別資料集
- 機器學習中的有標註資料集和無標註資料集機器學習
- 高精地圖中地面標識識別技術歷程與實踐地圖
- opencv圖片處理與OCR識別OpenCV
- 10張資料分析知識腦圖,包含學習步驟和工具合集,建議收藏
- 地圖資料採集,包括百度地圖採集,高德地圖採集,360地圖採集地圖
- 6種常見的地標識別演算法整理和總結演算法
- CVPR 2022資料集彙總|包含目標檢測、多模態等方向
- 人臉識別資料集和特點
- 圖片標註工具labelme安裝和使用
- 目標檢測資料集,全部有標註
- 字型圖片批次生成-字型識別模型資料模型
- 2020全球資料安全標準和認證展望
- 處理圖片流資料
- Tesseract 圖片識別
- yolov8_資料集標註YOLO
- 目標檢測資料集分析
- 影象識別及處理相關資料集介紹
- 標籤 圖片載入失敗時候處理方案
- 圖片文字識別工具怎樣進行批次識別圖片?
- labelme標註後的圖片切成小圖和小jsonJSON
- 四角游標跟隨滑鼠, 滑鼠落在哪個圖片上, 游標就跟隨到哪張圖片 (一種實現思路)
- 如何用Python讀取xml檔案後,裁剪標註圖片和擴容資料PythonXML
- 【為生活開發系列之四】圖片文字識別與標準文件對比工具
- 地圖POI類別標籤體系建設實踐地圖
- 一張圖認識天下資料庫資料庫
- oracle遊標批次處理資料Oracle
- 帝國CMS靈動標籤無標題圖片縮圖時呼叫指定預設圖片
- 深度瞭解語音識別之發音詞典及語音資料採集標註
- AI人工智慧—資料標註的主要型別和標註注意事項AI人工智慧型別
- paddleocr圖片文字識別
- 專業資料標註公司和智慧資料標註平臺
- 百度地圖框選標註座標點功能地圖
- 使用AI和LiDAR標註來解決道路擁堵問題 | 資料標註AI
- 一文詳解面向自動駕駛的高精地圖資料採集標註體系自動駕駛地圖
- ECharts圖座標軸文字換行問題處理Echarts
- 高德地圖api標記點和線段重合點選響應問題地圖API
- Spring Boot MVC 單張圖片和多張圖片上傳 和通用檔案下載Spring BootMVC