全球最大地標識別資料集問世:包含200萬張圖片和3萬處地標
安妮 編譯自 Google Research Blog
量子位 出品 | 公眾號 QbitAI
今天,谷歌推出了目前世界上最大的人造和自然地標識別資料集Google-Landmarks。資料集中包含200萬張圖片,描述了3萬處全球獨特地標,量級是普通的資料集的30倍。
△ 資料集中地標的位置分佈
兩場競賽
和這個資料集一同推出的,還有兩場相關的資料競賽:地標識別(Landmark Recognition)挑戰和地標檢索(Landmark Retrieval)挑戰。谷歌在部落格中表示,這將成為Kaggle競賽的賽題,也設有相應的獎金。
這場競賽的後續訊息,還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。
谷歌路標識別挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-recognition-challenge
谷歌路標檢索挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-retrieval-challenge
地標識別和其他問題比較大的區別在於,即使在一個大型標註過的資料集,對一個不太知名的地標也可能訓練得不夠。
此外,由於地標建築不會移動並且內部的變化非常小,因此,影像的拍攝條件,如遮擋、不同視角、天氣和光線等因素決定了地標影像的變化。但其他的普通資料集(比如萌犬資料集),往往變化多樣。
這兩個Kaggle挑戰提供了標註資料,幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試影像資料集中,讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中,參與者需要檢索包含相同地標的影像。
△ 資料集中部分地標建築
開源DELF
講到這裡還沒完。為了刺激這個領域的研究,谷歌研究人員還開源了專注本地特徵的描述符Deep Local Features(DELF)。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年,一個月前又進行了一次修改。
論文地址:
https://arxiv.org/abs/1612.06321
DELF開原始碼和資料集地址:
https://github.com/tensorflow/models/tree/master/research/delf
最後,附谷歌部落格介紹地址:
https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html
— 完 —
加入社群
量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微訊號qbitbot5,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。
量子位 QbitAI · 頭條號簽約作者
վ'ᴗ' ի 追蹤AI技術和產品新動態
相關文章
- 拆分PPOCRLabel標註的資料集並生成識別資料集
- 機器學習中的有標註資料集和無標註資料集機器學習
- 複合資料型別和遊標資料型別
- 6種常見的地標識別演算法整理和總結演算法
- 如何使用機器學習進行影像識別 | 資料標註機器學習
- 目標檢測資料集,全部有標註
- 人臉識別資料集和特點
- 目標檢測資料集分析
- yolov8_資料集標註YOLO
- 包含近 20 萬本圖書,OpenAI 級別的訓練資料集上線OpenAI
- 影象識別及處理相關資料集介紹
- FastCopy包含和排除資料夾處理AST
- 資料訪問模式:Identity Map(標識對映)模式模式IDE
- oracle遊標批次處理資料Oracle
- 高精地圖中地面標識識別技術歷程與實踐地圖
- 深度瞭解語音識別之發音詞典及語音資料採集標註
- 指向常量資料的指標和常量指標指標
- AI人工智慧—資料標註的主要型別和標註注意事項AI人工智慧型別
- 專業資料標註公司和智慧資料標註平臺
- CVPR 2022資料集彙總|包含目標檢測、多模態等方向
- 目標檢測兩種常用的資料集COCO和VOC
- 全面認識資料指標體系指標
- 2020全球資料安全標準和認證展望
- 資料標準和資料規範到底有什麼區別?
- SAR目標檢測資料集彙總
- 使用AI和LiDAR標註來解決道路擁堵問題 | 資料標註AI
- 深度學習之目標檢測與目標識別深度學習
- 如何提高資料標註質量,提供精細化標註資料集?丨曼孚科技
- WEB端:裝置標識號如何識別?Web
- 2 萬字 + 20張圖| 細說 Redis 九種資料型別和應用場景Redis資料型別
- 2 萬字 + 20張圖| 細說 Redis 九種資料型別和應用場景Redis資料型別
- 人工智慧資料標註案例之人臉識別 | 景聯文科技人工智慧
- 關於資料庫標識類引數資料庫
- 標準HTML識別符號 (轉)HTML符號
- 一個利用遊標返回資料集的例子
- 資料標準化遇到的問題
- 世界人工智慧大會建立醫療AI標準資料集,AI發展仍需處理多個資料問題人工智慧AI
- 一張圖認識天下資料庫資料庫