全球最大地標識別資料集問世:包含200萬張圖片和3萬處地標

量子位發表於2018-03-02
安妮 編譯自 Google Research Blog
量子位 出品 | 公眾號 QbitAI

今天,谷歌推出了目前世界上最大的人造和自然地標識別資料集Google-Landmarks。資料集中包含200萬張圖片,描述了3萬處全球獨特地標,量級是普通的資料集的30倍。

640?wx_fmt=png&wxfrom=5&wx_lazy=1 資料集中地標的位置分佈

兩場競賽

和這個資料集一同推出的,還有兩場相關的資料競賽:地標識別(Landmark Recognition)挑戰和地標檢索(Landmark Retrieval)挑戰。谷歌在部落格中表示,這將成為Kaggle競賽的賽題,也設有相應的獎金。

這場競賽的後續訊息,還將出現在今年6月份的CVPR 2018會議的Landmarks workshop中。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

谷歌路標識別挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-recognition-challenge

谷歌路標檢索挑戰賽(內含資料集下載):
https://www.kaggle.com/c/landmark-retrieval-challenge

地標識別和其他問題比較大的區別在於,即使在一個大型標註過的資料集,對一個不太知名的地標也可能訓練得不夠。

此外,由於地標建築不會移動並且內部的變化非常小,因此,影像的拍攝條件,如遮擋、不同視角、天氣和光線等因素決定了地標影像的變化。但其他的普通資料集(比如萌犬資料集),往往變化多樣。

這兩個Kaggle挑戰提供了標註資料,幫助研究人員解決這些問題。路別識別競賽是在具有挑戰性的測試影像資料集中,讓參賽者構建識別正確地標的模型。而在路標檢索挑戰賽中,參與者需要檢索包含相同地標的影像。

640?wx_fmt=png 資料集中部分地標建築

開源DELF

講到這裡還沒完。為了刺激這個領域的研究,谷歌研究人員還開源了專注本地特徵的描述符Deep Local Features(DELF)。關於DELF的論文Large-Scale Image Retrieval with Attentive Deep Local Features首次亮相於2016年,一個月前又進行了一次修改。

論文地址:

https://arxiv.org/abs/1612.06321

DELF開原始碼和資料集地址:

https://github.com/tensorflow/models/tree/master/research/delf

最後,附谷歌部落格介紹地址:

https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html

加入社群

量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進群請加小助手微訊號qbitbot5,並務必備註相應群的關鍵詞~通過稽核後我們將邀請進群。(專業群稽核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


相關文章