重識別（re-ID）特徵適合直接用於跟蹤（tracking）問題麼？

AIBigbull2050發表於2020-02-13

原文網址 : http://blog.itpub.net/69946223/viewspace-2674255/

本文要介紹的是澳洲國立大學（Australian National University）鄭良老師實驗室和清華大學電子系計算機視覺實驗室合作的工作《Locality Aware Appearance Metric for Multi-Target Multi-Camera Tracking》。

文章指出跟蹤（tracking）問題和重識別（re-ID）問題存在一個本質區別： 區域性匹配vs全域性匹配。跟蹤系統只需匹配區域性鄰域（同一相機相鄰幀/相鄰相機）內的樣本；而重識別系統需要全域性（全部相機的所有資料）搜尋、匹配。該區別導致在跟蹤這一區域性匹配問題上，直接應用全域性學習到的重識別特徵，並不能得到最好的結果[1]。面對這個區別/失配，文章提出了一套可學的，關注區域性鄰域內目標外觀的度量（Locality Aware Appearance Metric）。

文章連結： arXiv ；程式碼： re-id feature extraction , tracker & Locality Aware Appearance Metric

寫在前面

本文中提到的區域性/全域性並不指代單張行人圖片中的部分/整體；而是指代待匹配資料的選擇範圍。如上圖（題圖）所示，重識別系統（第一行）在查詢所有相機進行匹配；單相機跟蹤（第二行）只關心同相機相鄰幀，不關心其他相機（紅叉）；多相機跟蹤（第三行）只關心相鄰相機，不關心距離太遠，目標不可能連續出現的相機（紅叉）。

什麼是多目標、多相機跟蹤（multi-target multi-camera tracking）？

多目標、多相機跟蹤（multi-target multi-camera tracking）問題，關注多個相機內的每一幀中，每個目標的身份（如下方視訊，每種顏色對應一個identity），以及所在的位置（bounding box和身後的軌跡）[1]。

多目標、多相機跟蹤示例

在跟蹤系統中，相似度估計（similarity estimation）作為資料匹配（data association）的標準，是一個非常重要的部分。近期，隨著行人/車輛重識別技術的飛速發展，重識別特徵也被廣泛利用於跟蹤問題中的外觀相似度估計。

為什麼跟蹤是一個區域性匹配問題？

由於目標（行人/車輛）軌跡（trajectory）的連續性，在一般情況下，跟蹤系統只需要匹配一個區域性鄰域（local neighbor）中的目標[1]，而不需要 全域性匹配。

區域性鄰域：對於單相機跟蹤，指代同相機的連續幀內的樣本；對於跨相機跟蹤，指代相鄰（距離較小）的幾個相機（如下圖小框中的一組相機）內的樣本。
全域性：指代全部相機中的樣本。

CityFlow 多目標、多相機跟蹤問題場景。藍色小旗代表一個相機。為了簡化問題，在匹配時，跟蹤系統一般會利用時間滑動窗。多相機匹配時，滑窗大概率會將相鄰相機（如圖中各個小框包含相機）內的候選目標選出，即區域性匹配。

為什麼重識別是一個全域性匹配問題？

不同於跟蹤問題，在一般情況下，重識別系統無法得到目標的軌跡。因此，重識別系統一般難以將匹配範圍限制在區域性鄰域，重識別問題也被描述成一個 全域性匹配問題。為了解決這個全域性匹配問題，重識別特徵一般由全域性隨機取樣訓練而成[2,3,4]。

區域性vs全域性的失配在哪裡？

如上文提到的，跟蹤系統中的匹配一般被限制在區域性鄰域內；而應用於相似度估計的重識別特徵，則是從全域性學到的。相似度估計的結果直接決定資料匹配的效能。在這個關鍵部分，出現了 區域性vs全域性的失配，則會對系統整體效能有很大影響。如下圖所示，全域性度量（global metric）一般利用模型的全部效能照顧各類外觀變化。在區域性鄰域內，樣本直接的區分一般較小（同相機連續幀/相鄰相機之間，可能出現的外觀變化有限；遠遠小於全部相機間的各種組合），全域性模型由於能力有限，卻不能有效區分相似樣本（見下圖A）。

注意，這篇文章指出的區域性vs全域性的失配，是指基於外觀（appearance）的相似度評估，和利用時空資訊縮小範圍不一樣。

A. 全域性度量（global metric）在區域性匹配中，不能有效區分相似的樣本。B. 區域性鄰域內目標外觀的度量（spatial locality metric），能夠有效區分相似樣本：區域性匹配中，需要考慮的外觀變化更少，區域性度量可以將能力投入可能出現的外觀變化。C/D. 單相機/多相機跟蹤對應的區域性度量。

如何訓練區域性鄰域內目標外觀的度量（Locality Aware Appearance Metric）？

這篇文章提出了一種區域性鄰域內目標外觀的度量。這種度量不需要照顧全域性匹配中的各種外觀變化；相反，它只需要照顧區域性匹配中可能出現的幾種外觀變化，對於相似樣本也更加有效。

特別的，對於單相機跟蹤/多相機跟蹤，文章分別提出了相機內（intra-camera）/相機間度量(inter-camera metric)。類似於跟蹤系統為了限制匹配範圍使用的時間滑動窗（temporal sliding window），文章也利用了相似的樣本選擇窗（data sampling window）訓練相機內/相機間度量。

相機內度量：通過樣本選擇窗，選擇同相機相鄰幀內的正負樣本對。
相機間度量：通過樣本選擇窗，選擇不同相機的正樣本對，以及來自任意相機的負樣本對。

訓練相機內/相機間度量的兩種樣本選擇窗區域性敏感的外觀度量使用最基礎的全連線模型和交叉熵損失函式

文章的主要貢獻在於發現跟蹤系統相似度估計和重識別特徵之間， 區域性vs全域性的失配；並提出一套簡單易行的訓練區域性鄰域內目標外觀度量的方法。該度量使用的模型和損失函式，並非文章的貢獻點。如上圖，文章使用了最基礎的全連線模型和交叉熵損失函式。

實驗結果

區域性度量可以明顯降低匹配錯誤率

2. 區域性度量在多種重識別特徵(IDE[2], triplet[3], PCB[4])上的跟蹤效能提高

3. 提出的度量在多個跟蹤資料集（CityFlow, DukeMTMC）上的跟蹤效能提高

參考文獻

[1]. Ergys Ristani and Carlo Tomasi. Features for multi-target multi-camera tracking and re-identification. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 6036-6046, 2018.

[2]. Liang Zheng, Liyue Shen, Lu Tian, Shengjin Wang, Jingdong Wang, and Qi Tian. Scalable person re-identification: A benchmark. In Proceedings of the IEEE International Conference on Computer Vision, pages 1116–1124, 2015.

[3]. Alexander Hermans, Lucas Beyer, and Bastian Leibe. In defense of the triplet loss for person re-identification. arXiv preprint arXiv:1703.07737, 2017.

[4]. Yifan Sun, Liang Zheng, Yi Yang, Qi Tian, and Shengjin Wang. Beyond part models: Person retrieval with refined part pooling (and a strong convolutional baseline). In ECCV, 2018.

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2674255/，如需轉載，請註明出處，否則將追究法律責任。

package-tracking-app: Golang+RabbitMQ實時包裹跟蹤應用
2022-07-13
PackageAPPGolangMQ
基於深度學習的機器人目標識別和跟蹤
2022-08-02
深度學習機器人
ActionView - 更好用的問題需求跟蹤工具
2018-07-18
View
關於影像識別的問題
2023-01-31
【YashanDB知識庫】windows配置ODBC跟蹤日誌，使用日誌定位問題
2024-09-27
Windows
AI開發實踐：關於停車場中車輛識別與跟蹤
2023-04-06
AI
基於開源模型搭建實時人臉識別系統（五）：人臉跟蹤
2023-11-01
模型
樹莓派利用OpenCV的影像跟蹤、人臉識別等
2022-06-29
樹莓派OpenCV
【TRACE】如果通過10046跟蹤資料庫效能問題
2022-03-01
資料庫
CVPR2016跟蹤演算法Staple的配置（Staple: Complementary Learners for Real-Time Tracking）
2019-01-14
演算法
利用目標跟蹤來提高實時人臉識別處理速度
2020-09-02
基於 OpenCv 和 Python 的手指識別及追蹤
2018-12-16
OpenCVPython
【Eye-Tracking】一、眼動追蹤概述
2018-03-30
深度學習基礎5:交叉熵損失函式、MSE、CTC損失適用於字識別語音等序列問題、Balanced L1 Loss適用於目標檢測
2023-04-18
深度學習熵函式
基於 SVM 和增強型 PCP 特徵的和絃識別
2020-05-29
特徵
如何使用專案問題追蹤軟體跟進管理專案
2023-03-15
有個關於多執行緒的識別問題
2020-05-08
執行緒
特徵選擇和特徵生成問題初探
2018-07-29
特徵
目標跟蹤新高度ECO+：解除深度特徵被封印的力量
2018-08-09
特徵
0基礎的人，直接學Python合適嗎？
2022-02-09
Python
一個ssh無法遠端登入的問題跟蹤解決
2023-12-26
企業如何用專案管理軟體做好專案問題跟蹤？
2022-05-14
專案管理
一個基於高階圖匹配的多目標跟蹤器：Online Multi-Target Tracking with Tensor-Based High-Order Graph Matching
2020-12-08
ICCV2021 | 用於視覺跟蹤的學習時空型transformer
2021-12-10
視覺ORM
為 fastapi 新增全域性唯一請求id，用於日誌跟蹤
2022-02-26
ASTAPI
父母離異，姐妹不合，父母的養老問題怎麼安排適合？
2022-01-18
使用合適的維度拆分來求解問題
2024-07-28
Android開發之跟蹤應用更新大小
2019-04-11
Android
什麼是六西格瑪，六西格瑪適合解決什麼問題？
2021-02-25
Git的reset和revert有什麼區別？它們分別適用於什麼場景？
2024-11-24
Git
實時 3D 深度多攝像頭跟蹤 Real-time 3D Deep Multi-Camera Tracking
2024-04-09
3D
基於深度神經網路的人臉識別相關問題
2024-05-30
神經網路
Android 程式碼跟蹤到native怎麼辦
2019-04-13
Android
sp_trace_setfilter sqlserver篩選跟蹤或跟蹤過濾
2020-04-05
FilterSQLServer
Spring Cloud 專題之七：Sleuth 服務跟蹤
2021-08-15
SpringCloud
人臉識別之特徵臉方法（Eigenface）
2020-04-06
特徵
主力跟蹤戰法
2024-10-16
反跟蹤技術
2021-01-05