CVPR2019|微軟、中科大開源基於深度高分辨表示學習的姿態估計演算法
作者 | 周強(CV君)
來源 | 我愛計算機視覺(公眾號id:aicvml)
如何挑戰百萬年薪的人工智慧!
https://edu.csdn.net/topic/ai30?utm_source=csdn_bw
昨天arXiv出現了好幾篇被CVPR 2019接收的論文。
其中來自微軟和中國科技大學研究學者的論文《Deep High-Resolution Representation Learning for Human Pose Estimation》和相應程式碼甫一公佈,立刻引起大家的關注,不到一天之內,github上已有將近50顆星。
今天就跟大家一起來品讀此文妙處。
該文作者資訊:
該文為第一作者Ke Sun在微軟亞洲研究院實習期間發明的演算法。
基本思想
作者觀察到,現有姿態估計演算法中往往網路會有先降低解析度再恢復高解析度的過程,比如下面的幾種典型網路。
為便於表達,在下面的a、b、c、d四幅圖中,同一水平線上的特徵圖為相同解析度,越向下解析度越小,在最終的高解析度特徵圖heatmap中計算姿態估計的關鍵點。
Hourglass
Cascaded pyramid networks
Simple baseline
Combined with dilated convolutions
其中的網路結構說明如下:
作者希望不要有這個解析度恢復的過程,在網路各個階段都存在高解析度特徵圖。
下圖簡潔明瞭地表達作者的思想。
在上圖中網路向右側方向,深度不斷加深,網路向下方向,特徵圖被下采樣解析度越小,相同深度高解析度和低解析度特徵圖在中間有互相融合的過程。
作者描述這種結構為不同解析度子網路並行前進。
關鍵點的heatmap是在最後的高解析度特徵圖上計算的。
網路中不同解析度子網路特徵圖融合過程如下:
主要是使用strided 3*3的卷積來下采樣和up sample 1*1卷積上取樣。
這麼做有什麼好處?
作者認為:
1)一直維護了高解析度特徵圖,不需要恢復解析度。
2)多次重複融合特徵的多解析度表示。
實驗結果
該演算法在COCO姿態估計資料集的驗證集上測試結果:
與目前的state-of-the-art比較,取得了各個指標的最高值。相同解析度的輸入影像,與之前的最好演算法相比增長了3個百分點!
在COCO test-dev資料集上,同樣一騎絕塵!
在MPII test 資料集上,同樣取得了最好的結果!
作者進一步與之前最好模型比較了引數量、計算量,該文發明的HRNet-W32在精度最高的同時,計算量最低!
如下圖:
在PoseTrack2017姿態跟蹤資料集上的結果比較:
同樣取得了最好的結果。
下圖是演算法姿態估計的結果示例:
(請點選檢視大圖)
不僅僅是姿態估計
作者在官網指出,深度高解析度網路不僅對姿態估計有效,也可以應用到計算機視覺的其他任務,諸如語義分割、人臉對齊、目標檢測、影像分類中,期待更多具有說服力的結果公佈。
論文地址:
http://cn.arxiv.org/pdf/1902.09212.pdf
專案主頁:
https://jingdongwang2017.github.io/Projects/HRNet/PoseEstimation.html
程式碼地址:
https://github.com/leoxiaobin/deep-high-resolution-net.pytorch
(本文為AI科技大本營轉載文章,轉載請微信聯絡原作者)
人工智慧的現狀及今後發展趨勢如何?
https://edu.csdn.net/topic/ai30?utm_source=csdn_bw
群招募
掃碼新增小助手微信,回覆:公司+研究方向(學校+研究方向),邀你加入技術交流群。技術群稽核較嚴,敬請諒解。
推薦閱讀:
點選“閱讀原文”,檢視歷史精彩文章。
相關文章
- 深度學習中的人體姿態估計概述深度學習
- 基於三維重建的全新相機姿態估計方法
- 基於TensorFlow Serving的深度學習線上預估深度學習
- 人體姿態估計——PBN
- 深度學習|基於MobileNet的多目標跟蹤深度學習演算法深度學習演算法
- 人體姿態估計研究文集
- 基於深度學習的影像分割在高德的實踐深度學習
- 頭部姿態估計 - OpenCV/Dlib/CeresOpenCV
- 新鮮開源:基於TF2.0的深度強化學習平臺TF2強化學習
- 深度學習之影象超分辨重建技術深度學習
- 從DeepNet到HRNet,這有一份深度學習“人體姿勢估計”全指南深度學習
- 由微軟打造的深度學習開放聯盟ONNX成立微軟深度學習
- 基於動態規劃的強化學習演算法動態規劃強化學習演算法
- CVPR 2019 | 騰訊AI Lab聯合清華大學提出基於骨骼姿態估計的人體例項分割AI
- 基於pytorch的深度學習實戰PyTorch深度學習
- 基於TensorFlow的深度學習實戰深度學習
- 學習軟體開發的正確姿勢
- PyraNet:基於特徵金字塔網路的人體姿態估計 | 經典論文復現特徵
- 完全基於 Java 的開源深度學習平臺,亞馬遜的大佬帶你上手Java深度學習亞馬遜
- 基於深度強化學習(DQN)的迷宮尋路演算法強化學習演算法
- 【機器學習基礎】關於深度學習的Tips機器學習深度學習
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- 微軟開源機器學習框架——infer.NET微軟機器學習框架
- 【深度學習-基於Tensorflow的實戰】公開課實況深度學習
- 解讀微軟開源MMLSpark:統一的大規模機器學習生態系統微軟Spark機器學習
- 雙目深度估計中的自監督學習概覽
- 《深度學習案例精粹:基於TensorFlow與Keras》案例集用於深度學習訓練深度學習Keras
- 深度學習開發必備開源框架深度學習框架
- 基於深度學習的醫學影像配準學習筆記2深度學習筆記
- m基於深度學習的OFDM+QPSK鏈路通道估計和均衡演算法誤位元速率matlab模擬,對比LS,MMSE及LMMSE傳統演算法深度學習演算法Matlab
- 基於深度學習的停車場車輛檢測演算法matlab模擬深度學習演算法Matlab
- 深度學習AI美顏系列----基於摳圖的人像特效演算法深度學習AI特效演算法
- 基於自注意力機制的輕量級人體姿態估計(Lightweight Human Pose Estimation Based on Self-Attention Mechanism)
- 基於深度學習模型Wide&Deep的推薦深度學習模型IDE
- 基於深度學習的影像超解析度重建深度學習
- DeepVS:基於深度學習的影片顯著性方法深度學習
- 基於深度學習的影象超解析度重建深度學習
- 基於深度學習的單通道語音增強深度學習