來看看微軟亞洲研究院的一些牛人推薦的計算機視覺專案,希望對我們的同學們在影象演算法方向選擇有所幫助。
主要分為目標檢測,語義和例項分割,人體姿態估計,人臉對齊,高效輕量卷積神經網路結構設計,行人重新識別,視訊目標檢測,目標跟蹤,最近鄰搜尋等領域。
目標檢測
1. HRNet-物件檢測
微軟亞洲研究院視覺計算小組提出的一種新的骨幹網路結構可以學習高解析度表示並提高目標的空間精度,尤其是小目標。支援多規模同步訓練。
論文:
https://arxiv.org/pdf/1904.04514.pdf
原始碼:
https://github.com/HRNet/HRNet-Object-Detection
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark
https://github.com/HRNet/HRNet-FCOS
2.可變形卷積網路
微軟亞洲研究院視覺計算組提出的具有幾何變形建模的卷積神經網路
論文:
https://arxiv.org/abs/1703.06211
https://arxiv.org/abs/1811.11168
原始碼:
https://github.com/msracver/Deformable-ConvNets
3.關係網路
Microsoft計算研究小組的Visual Computing Group建議使用物件之間的相關性來提高物件檢測器的效能。
論文:
https://arxiv.org/pdf/1711.11575.pdf
原始碼:
https://github.com/msracver/Relation-Networks-for-Object-Detection
語義和例項分割
1. HRNet-語義分割
微軟亞洲研究院視覺計算組提出的一種新的骨幹網路結構可以學習高解析度表示,有效地提高語義分割的效能。
論文:
Https://arxiv.org/pdf/1904.04514.pdf
原始碼:
https://github.com/HRNet/HRNet-Semantic-Segmentation
https://github.com/HRNet/HRNet-MaskRCNN-Benchmark
2.完全卷積的例項感知語義分割
由微軟亞洲研究院的Visual Computing Group提出的基於完整卷積網路的端到端例項分割系統在COCO2016競賽中贏得了冠軍。
論文:
Https://arxiv.org/pdf/1611.07709.pdf
原始碼:
https://github.com/msracver/FCIS
人體姿勢估計
1. HRNet-人體姿態估計
微軟亞洲研究院視覺計算組提出的一種新的骨幹網路結構可以學習高解析度表示,有效提高人體關鍵點熱圖空間的準確性。
論文:
Https://arxiv.org/pdf/1902.09212.pdf
原始碼:
Https://github.com/leoxiaobin/deep-high-resolution-net.pytorch
2. SimplePose
微軟亞洲研究院視覺計算組提出的網路結構用於檢測人體的關鍵任務,簡單有效。
論文:
Https://arxiv.org/abs/1804.06208
原始碼:
https://github.com/Microsoft/human-pose-estimation.pytorch
3.整體人體花瓶
微軟亞洲研究院的Visual Computing Group提出了一種整合操作,以處理3D人體姿勢估計任務中的後處理/量化不可匯出問題。
論文:
Https://arxiv.org/abs/1711.08229
原始碼:
https://github.com/JimmySuen/integral-human-pose
面部對齊
1. HRNet-面部 - 地標 - 檢測
微軟亞洲研究院視覺計算組提出的一種新的骨幹網路結構可以學習高解析度表示,有效地提高人臉檢測的效能。
論文:
Https://arxiv.org/pdf/1904.04514.pdf
原始碼:
https://github.com/HRNet/HRNet-Facial-Landmark-Detection
高效輕量級卷積神經網路結構設計
1.人力資源網路分類
由Microsoft Research Asia的Visual Computing Group提出的新的骨幹網路結構可以學習多解析度表徵,然後結合多解析度表徵來進行影象識別。
論文:
Https://arxiv.org/pdf/1904.04514.pdf
原始碼:
https://github.com/HRNet/HRNet-Image-Classification
2.交織群體卷積
微軟亞洲研究院的Visual Computing Group提出的輕量級網路結構在分類和檢測等任務中取得了比谷歌MobileNetv2更好的結果。
論文:
Https://arxiv.org/pdf/1707.02725.pdf
Https://arxiv.org/pdf/1804.06202.pdf
Https://arxiv.org/pdf/1806.00178.pdf
原始碼:
https://github.com/homles11/IGCV3
3.行人重新識別
深入學習的部分對齊表示
微軟計算研究小組的視覺計算小組建議使用身體部位資訊來提取行人代表。
論文:
http://openaccess.thecvf.com/content_ICCV_2017/papers/Zhao_Deeply-Learned_Part-Aligned_Representations_ICCV_2017_paper.pdf
原始碼:
Https://github.com/zlmzju/part_reid
2.部分對齊的雙線性表示
微軟亞洲研究院的視覺計算小組提出了一種雙線性池化方法,將人類手勢結合起來以提取行人代表性。
論文:
http://openaccess.thecvf.com/content_ECCV_2018/papers/Yumin_Suh_Part-Aligned_Bilinear_Representations_ECCV_2018_paper.pdf
原始碼:Https://github.com/yuminsuh/part_bilinear_reid
視訊目標檢測
1.深度特徵低
由Microsoft Research Asia的Visual Computing Group提出的視訊理解組的視訊結構使用視訊之間的光流資訊來傳達相鄰幀之間的預測。
論文:
Https://arxiv.org/abs/1611.07715
原始碼:
https://github.com/msracver/Deep-Feature-Flow
2.流引導特徵聚合
由Microsoft Research Asia的Visual Computing Group提出的視訊中的物件檢測問題的框架使用光流來幫助組合相鄰幀的表徵。
論文:
Https://arxiv.org/pdf/1703.10025.pdf
原始碼:
https://github.com/msracver/Flow-Guided-Feature-Aggregation
目標跟蹤
1.更深入,更廣泛的暹羅網路
微軟研究院多媒體搜尋和挖掘小組提出的更深入和更廣泛的雙網路解決了目標跟蹤問題。
論文:
Https://arxiv.org/abs/1901.01660
原始碼:
https://github.com/researchmm/SiamDW
最近鄰搜尋
1. SPTAG
微軟Bing產品中使用了由Microsoft Systems Research Group和Microsoft Bing Group聯合推出的能夠處理數億個資料的索引和搜尋系統。
論文:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.862.7975&rep=rep1&type=pdf
http://pages.ucsd.edu/~ztu/publication/cvpr12_knnG.pdf,
https://ieeexplore.ieee.org/iel7/34/4359286/06549106.pdf
原始碼:
https://github.com/Microsoft/SPTAG
2.複合量化
由Microsoft Research Asia的Visual Computing Group提出的一種有效的緊湊編碼(雜湊)演算法。
論文:
http://proceedings.mlr.press/v32/zhangd14.pdf
原始碼:
https://github.com/hellozting/CompositeQuantization