曠視開源了一套影像檢索和ReID的PyTorch庫

我爱计算机视觉發表於2020-05-09

原文網址 : https://www.jiqizhixin.com/articles/2020-05-09-6

曠視開源了一套影像檢索和 ReID 的 PyTorch 庫，論文“PyRetri: A PyTorch-based Library for Unsupervised Image Retrieval by Deep Convolutional Neural Networks”介紹了其主要內容。

曠視開源了一套影像檢索和ReID的PyTorch庫

01 架構

深度學習影像檢索無監督方法的架構：

曠視開源了一套影像檢索和ReID的PyTorch庫

在特徵提取階段，包含：資料增強（Data Augmentation對影像做各種變換）、骨幹網選擇（Backbone，使用不同的骨幹網架構和預訓練模型）、特徵聚合（Aggregation，將不同網路提取的特徵聚合成一個特徵向量）。
在索引階段，包含：維度處理（Dimension Process，PCA降維等）、特徵增強（Feature Enhance）、距離度量（Distance Metric，衡量樣本之間的相似性）、重排序（Rerank，對相似度較高的影像按照再次查詢等方法重新排序）。
在評估階段，包含：結果量化（Quantitative results）和視覺化（Visualization）。

02 方法

該庫目前支援的方法：

1、前處理方法：

DirectResize (DR): 將影像長寬縮放到目標大小；
PadResize (PR): 根據影像長邊將影像等比例縮放到目標大小，空白區域用ImageNet均值填充；
ShorterResize (SR): 根據影像短邊將影像等比例縮放到目標大小；
TwoFlip (TF): 返回原始影像和水平翻轉影像；
CenterCrop (CC): 從影像中心crop出目標大小的影像區域；
TenCrop (TC): crop影像並按照上下左右翻轉

2、特徵表示方法：

曠視開源了一套影像檢索和ReID的PyTorch庫

3、後處理方法：

SVD : 使用矩陣SVM分解降維；
PCA : PCA降維度；
DBA : 資料庫中每一個特徵用它自己和自己的近鄰的加權和表示；
QE : 使用返回的 top-k 近鄰和原始查詢影像再進行一次檢索；
k-reciprocal : 編碼K個倒數最近鄰，增強檢索精度。

特別值得一提的是，為了降低使用者選擇不同演算法和超引數配置的難度，PyRetri提供了自動化的配置搜尋工具，可根據使用者定義的搜尋空間和搜尋指令碼，自動選擇最優的演算法流程。

03 結果

作者在基於內容的影像檢索（CBIR）和行人重識別（ReID）常用資料集 Oxford5k、CUB-200-2011、Indoor、Caltech101、Market-1501上進行了實驗。

曠視開源了一套影像檢索和ReID的PyTorch庫

上表列出了透過搜尋配置得到的前三個演算法配置和每個資料集上的baseline方案結果的比較，可見使用官方推薦的配置工具，大大提高了檢索mAP！

使用 PyRetri 檢索時各階段用時比較：

曠視開源了一套影像檢索和ReID的PyTorch庫

可見每幅影像平均時間還不到 8ms。

以下是在ReID問題上的實驗結果：

曠視開源了一套影像檢索和ReID的PyTorch庫

可見，PyRetri 較好的復現了經典論文的結果，而且如果使用自動搜尋配置的方法，能大幅提高精度！超過原方案10個百分點之多！

論文地址：

https://arxiv.org/abs/2005.02154

程式碼地址：

https://github.com/PyRetri/PyRetri

模型下載：

官方不僅開源了程式碼，也提供了在ImageNet、Places365、Market-1501、DukeMTMC-reID資料集上的預訓練模型，可惜國內無法下載。

相關文章

[資源]基於 Pytorch 的 TorchGAN開源了！
2018-12-30
PyTorch
曠視宣佈開源深度學習框架“天元”
2020-03-26
深度學習框架
Kornia開源可微分計算機視覺庫，基於Pytorch
2020-11-14
計算機視覺PyTorch
全文檢索庫 bluge
2021-12-20
資料庫的檢索語句
2020-04-05
資料庫
曠視開源的AI人像影片生成太炸了！輸入照片即可模仿任意表情包
2024-06-26
AI
開源了！唱吧 UI 元件庫開源了！
2021-12-31
UI元件
曠視“天元”開源2週年釋放AI生產力
2022-03-25
AI
檢視tensorflow,pytorch是否可用GPU
2021-01-02
PyTorchGPU
藉助WebGL三維視覺化技術檢索3D動態影像
2018-03-02
Web視覺化3D
時序資料庫的秘密 —— 快速檢索
2022-12-05
資料庫
[Leetcode]303.區域和檢索&&304.二維區域和檢索
2019-01-03
LeetCode
輕量級影像檢視器 Lyn最新漢化版資源
2023-11-28
OpenCV特徵提取與影像檢索實現（附程式碼）
2018-03-03
OpenCV特徵
模式識別課程大作業 Shopee 商品影像檢索
2021-08-03
模式
檢索總結能力超博士後，首個大模型科研智慧體PaperQA2開源了
2024-09-12
大模型智慧體
在Linux命令列檢視影像的方法
2020-04-06
Linux命令列
【高階RAG技巧】使用二階段檢索器平衡檢索的效率和精度
2024-04-26
大廠技術實現 | 影像檢索及其在淘寶的應用 @計算機視覺系列
2022-01-22
計算機視覺
EdgeView 2 for Mac影像檢視器
2020-11-30
ViewMac
目標檢測和影像分類及其相關計算機視覺的影像分佈
2018-10-08
計算機視覺
曠視南京研究院魏秀參：細粒度影像分析綜述
2019-02-25
開源Mizu可以檢視Kubernetes API流量
2022-03-11
API
基於ElasticSearch實現商品的全文檢索檢索
2018-04-15
Elasticsearch
學術檢索資料庫總結
2021-01-05
資料庫
繼天元開源後，曠視亮出“看家本領”：推出Brain++商業版
2020-10-10
AI
輕量級影像瀏覽器和檢視器：Lyn for mac
2023-02-14
瀏覽器Mac
DeepMind圖網路庫開源了！
2018-10-22
快速影像檢視器：EdgeView 4 for Mac
2024-02-01
ViewMac
EdgeView 3 for Mac(快速影像檢視器)
2022-12-28
ViewMac
Linux終端怎麼檢視影像
2021-01-02
Linux
GearCase UI – 自己構建一套基於 Vue 的簡易開源元件庫
2018-12-06
UIVue元件
一套開源、強大且美觀的WPF UI控制元件庫 - HandyControl
2023-11-23
UI控制元件
沒辦法了，用 MySQL 做全文檢索也挺好的
2022-12-23
MySql
港中文開源視訊動作分析庫MMAction，目標檢測庫演算法大更新
2019-06-20
Mac演算法
如何開通向量檢索服務？
2024-11-25
PHP歷理檢視模板和標籤庫
2024-08-10
PHP
Linux中如何檢視開啟了哪些埠?
2024-02-20
Linux