6種常見的地標識別演算法整理和總結

華為雲開發者社群發表於2021-04-19

原文網址 : https://www.cnblogs.com/huaweiyun/p/14675677.html

摘要：地標識別，基於深度學習及大規模影像訓練，支援上千種物體識別及場景識別，廣泛應用於拍照識圖、幼教科普、圖片分類等場景。本文將為大家帶來6種關於地標識的演算法整理和總結。

地標識別，基於深度學習及大規模影像訓練，支援上千種物體識別及場景識別，廣泛應用於拍照識圖、幼教科普、圖片分類等場景。本文將為大家帶來6種關於地標識的演算法。

一、《1st Place Solution to Google Landmark Retrieval 2020》

演算法思路：

Step1：使用清洗過的GLDv2資料集訓練初始embedding模型。
Step2：使用全量GLDv2資料基於Step1得到的模型進行遷移學習。
Step3：逐步擴大訓練圖片的尺度（512*512，640*640，736*736），模型效能得到進一步提升。
Step4：增加清洗後的資料的訓練loss權重，進一步訓練模型。
Step5：模型融合。

Notes：

1、Backbone模型為Efficientnet+global average pooling，訓練使用了cosine softmax loss。
2、為了處理類別不均衡問題，使用了weighted cross entropy。

經驗總結：

1、清洗後的資料有利於模型快速收斂。
2、全量大資料集有利於模型學習到更好的特徵表示。
3、增加訓練解析度能提升模型效能。

6種常見的地標識別演算法整理和總結

二、《3rd Place Solution to “Google Landmark Retrieval 2020》

演算法思路：

Step1：使用CGLDv2訓練基礎模型用於提取GLDv2全量圖片特徵，使用DBSCAN聚類方法更新影像類別，進行資料清洗。
Step2：使用了Corner-Cutmix的影像增廣方法，進行模型訓練。
Notes：
1、backbone為ResNest200和ResNet152，GAP池化，1*1卷積降維到512維，損失函式為cross entropy loss。

三、《Two-stage Discriminative Re-ranking for Large-scale Landmark Retrieval》

演算法思路：

Step1：使用CNN特徵進行KNN搜尋，獲取相似圖片。
Step2：插入Step1遺漏的圖片進行重新排序。

Notes：

1、Backbone模型為ResNet-101+Generalized Mean (GeM)-pooling，訓練loss為ArcFace loss。
2、使用全域性特徵+區域性特徵對GLd-v2資料集進行清洗，用於後續模型訓練。

四、《2nd Place and 2nd Place Solution to Kaggle Landmark Recognition and Retrieval Competition 2019》

演算法思路：

1、使用GLD-v2全量資料分別訓練Resnet152、ResNet200等模型，訓練loss為ArcFace loss、Npairs loss，拼接各個backbone的特徵，使用PCA降到512維，作為影像的全域性特徵。
2、使用全域性特徵進行KNN搜尋，對搜尋結果使用SURF、Hassian-Affine 和root sift區域性特徵進行再排序，並且使用了DBA和AQE。

五、《Detect-to-Retrieve: Efficient Regional Aggregation for Image Search》

演算法思路：

Step1：使用GLD的帶bbox資料集，訓練Faster-RCNN或SSD檢測模型，用於地標框的提取。
Step2：提出了D2R-R-ASMK方法，用於檢測框內的區域性特徵提取與特徵聚合。

Step3：使用聚合後特徵在database中進行搜尋。

Notes：

1、D2R-R-ASMK基於DELF區域性特徵抽取和ASMK特徵聚合方法實現。

2、每張圖片提取4.05個region的時候效果最好，search的記憶體佔用會有相應增加。

六、《Unifying Deep Local and Global Features for Image Search》

演算法思路：

Step1：統一在同一個網路中提取全域性和區域性特徵
Step2：使用全域性特徵搜尋top100的相似圖片

Step3：使用區域性特徵對搜尋結果進行重排序

Notes：

1、全域性特徵使用GeM池化和ArcFace loss。

2、區域性特徵匹配使用Ransac方法。

本文分享自華為雲社群《地標識別演算法》，原文作者：阿杜。

點選關注，第一時間瞭解華為雲新鮮技術~

幾種常見的排序演算法總結
2023-11-21
排序演算法
幾種常見排序演算法總結
2018-06-03
排序演算法
Java常見知識點彙總（⑫）——==和equals的區別
2020-03-07
Java
常見排序演算法總結
2021-03-17
排序演算法
常見壓縮演算法總結
2024-11-12
演算法
四種常見NLP框架使用總結
2019-08-13
框架
Javascript常見演算法整理
2018-09-13
JavaScript演算法
總結幾種常見的垂直居中的佈局
2018-04-16
常見線纜介面型別總結
2018-09-23
型別
ES6常見面試題總結
2020-12-30
面試題
常見Java面試知識點總結
2018-03-30
Java面試
七種常見的陣列排序演算法整理(C語言版本)
2019-01-08
陣列排序演算法C語言
NLP知識總結和論文整理
2022-03-26
【乾貨】驗證碼的常見型別總結
2023-05-09
型別
「移動端」前端常見知識點總結
2021-08-27
前端
區塊鏈中五種常見共識演算法
2021-01-14
區塊鏈演算法
Java Object類和 String類常見問答 6k字+總結
2021-01-30
JavaObject
Java常見知識點彙總（①）——資料型別
2020-02-27
Java資料型別
常見啟用函式的介紹和總結
2020-08-10
函式
Java集合類常見面試知識點總結
2019-10-18
Java面試
MySQL 鎖常見知識點&面試題總結
2022-07-01
MySql面試題
golang 常見疑惑總結
2018-05-04
Golang
python常見漏洞總結
2022-05-01
Python
10種python常見的排序演算法！
2023-12-26
Python排序演算法
ORACLE常見檢視和表整理
2021-11-30
Oracle
常見的Web安全攻防知識點總結，你知道多少？
2022-08-26
Web
Java常見知識點彙總（⑩）——常見設計模式
2020-03-05
Java設計模式
Java常見知識點彙總（⑨）——異常
2020-03-04
Java
對四種限流演算法的思考和總結
2024-08-21
演算法
常見指標型別入門
2019-05-10
指標型別
幾種常見的JS遞迴演算法
2019-12-05
JS遞迴演算法
35.幾種常見的排序演算法
2019-02-13
排序演算法
Javascript 常見的迴圈方式總結
2023-05-18
JavaScript
常見的三種工廠模式區別
2020-02-27
模式
常見的三種沉浸式投影型別
2022-04-14
型別
Spring常見擴充總結
2018-10-06
Spring
Vue 常見問題總結
2020-09-11
Vue
TCP常見問題總結
2020-10-12
TCP

6種常見的地標識別演算法整理和總結

一、《1st Place Solution to Google Landmark Retrieval 2020》

二、《3rd Place Solution to “Google Landmark Retrieval 2020》

三、《Two-stage Discriminative Re-ranking for Large-scale Landmark Retrieval》

四、《2nd Place and 2nd Place Solution to Kaggle Landmark Recognition and Retrieval Competition 2019》

五、《Detect-to-Retrieve: Efficient Regional Aggregation for Image Search》

六、《Unifying Deep Local and Global Features for Image Search》

相關文章