全球最大地標識別資料集問世：包含200萬張圖片和3萬處地標

量子位發表於2018-03-02

原文網址 : https://blog.csdn.net/yh0vlde8vg8ep9vge/article/details/79428187

安妮編譯自 Google Research Blog
量子位出品 | 公眾號 QbitAI

今天，谷歌推出了目前世界上最大的人造和自然地標識別資料集Google-Landmarks。資料集中包含200萬張圖片，描述了3萬處全球獨特地標，量級是普通的資料集的30倍。

640?wx_fmt=png&wxfrom=5&wx_lazy=1 △ 資料集中地標的位置分佈

兩場競賽

和這個資料集一同推出的，還有兩場相關的資料競賽：地標識別（Landmark Recognition）挑戰和地標檢索（Landmark Retrieval）挑戰。谷歌在部落格中表示，這將成為Kaggle競賽的賽題，也設有相應的獎金。

這場競賽的後續訊息，還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

谷歌路標識別挑戰賽（內含資料集下載）：
https://www.kaggle.com/c/landmark-recognition-challenge

谷歌路標檢索挑戰賽（內含資料集下載）：
https://www.kaggle.com/c/landmark-retrieval-challenge

地標識別和其他問題比較大的區別在於，即使在一個大型標註過的資料集，對一個不太知名的地標也可能訓練得不夠。

此外，由於地標建築不會移動並且內部的變化非常小，因此，影像的拍攝條件，如遮擋、不同視角、天氣和光線等因素決定了地標影像的變化。但其他的普通資料集（比如萌犬資料集），往往變化多樣。

這兩個Kaggle挑戰提供了標註資料，幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試影像資料集中，讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中，參與者需要檢索包含相同地標的影像。

640?wx_fmt=png △ 資料集中部分地標建築

開源DELF

講到這裡還沒完。為了刺激這個領域的研究，谷歌研究人員還開源了專注本地特徵的描述符Deep Local Features（DELF）。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年，一個月前又進行了一次修改。

論文地址：

https://arxiv.org/abs/1612.06321

DELF開原始碼和資料集地址：

https://github.com/tensorflow/models/tree/master/research/delf

最後，附谷歌部落格介紹地址：

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html

— 完 —

加入社群

量子位AI社群13群開始招募啦，歡迎對AI感興趣的同學，加小助手微信qbitbot5入群；

此外，量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募，面向正在從事相關領域的工程師及研究人員。

進群請加小助手微訊號qbitbot5，並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。（專業群稽核較嚴，敬請諒解）

誠摯招聘

量子位正在招募編輯/記者，工作地點在北京中關村。期待有才氣、有熱情的同學加入我們！相關細節，請在量子位公眾號(QbitAI)對話介面，回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

拆分PPOCRLabel標註的資料集並生成識別資料集
2024-10-31
機器學習中的有標註資料集和無標註資料集
2023-05-08
機器學習
高精地圖中地面標識識別技術歷程與實踐
2019-11-14
地圖
opencv圖片處理與OCR識別
2018-10-17
OpenCV
10張資料分析知識腦圖，包含學習步驟和工具合集，建議收藏
2021-08-25
地圖資料採集，包括百度地圖採集，高德地圖採集，360地圖採集
2024-04-28
地圖
6種常見的地標識別演算法整理和總結
2021-04-19
演算法
CVPR 2022資料集彙總｜包含目標檢測、多模態等方向
2022-04-18
人臉識別資料集和特點
2020-12-11
圖片標註工具labelme安裝和使用
2024-11-16
字型圖片批次生成-字型識別模型資料
2024-12-09
模型
目標檢測資料集，全部有標註
2024-04-07
2020全球資料安全標準和認證展望
2020-04-27
處理圖片流資料
2019-04-15
Tesseract 圖片識別
2019-08-05
yolov8_資料集標註
2024-04-13
YOLO
目標檢測資料集分析
2022-04-19
影象識別及處理相關資料集介紹
2019-03-09
標籤圖片載入失敗時候處理方案
2019-02-16
圖片文字識別工具怎樣進行批次識別圖片？
2019-06-17
labelme標註後的圖片切成小圖和小json
2024-05-16
JSON
四角游標跟隨滑鼠, 滑鼠落在哪個圖片上, 游標就跟隨到哪張圖片 (一種實現思路)
2024-08-09
【為生活開發系列之四】圖片文字識別與標準文件對比工具
2018-03-08
如何用Python讀取xml檔案後，裁剪標註圖片和擴容資料
2020-12-28
PythonXML
地圖POI類別標籤體系建設實踐
2019-08-27
地圖
oracle遊標批次處理資料
2024-07-25
Oracle
一張圖認識天下資料庫
2019-02-11
資料庫
帝國CMS靈動標籤無標題圖片縮圖時呼叫指定預設圖片
2024-11-30
深度瞭解語音識別之發音詞典及語音資料採集標註
2023-02-03
AI人工智慧—資料標註的主要型別和標註注意事項
2023-01-31
AI人工智慧型別
paddleocr圖片文字識別
2024-04-17
專業資料標註公司和智慧資料標註平臺
2023-01-16
百度地圖框選標註座標點功能
2018-03-28
地圖
使用AI和LiDAR標註來解決道路擁堵問題 | 資料標註
2023-02-06
AI
ECharts圖座標軸文字換行問題處理
2019-12-24
Echarts
一文詳解面向自動駕駛的高精地圖資料採集標註體系
2023-01-31
自動駕駛地圖
高德地圖api標記點和線段重合點選響應問題
2024-03-08
地圖API
Spring Boot MVC 單張圖片和多張圖片上傳和通用檔案下載
2021-04-03
Spring BootMVC

全球最大地標識別資料集問世：包含200萬張圖片和3萬處地標

安妮 編譯自 Google Research Blog量子位 出品 | 公眾號 QbitAI

兩場競賽

開源DELF

相關文章

安妮編譯自 Google Research Blog
量子位出品 | 公眾號 QbitAI