nb_200930_2019_wnet

CherylHoo發表於2020-09-30

W-Net: Reinforced U-Net for Density Map Estimation

  • cvpr 2019

I. Introduction

  • 本文貢獻:
    • 演算法:
      1. 一個基於U-Net的 DME (密度圖估計,density map estimation) 模型。
        • 該模型採用了完全相同的encoder-decoder流水線結構,外加一個強化分支。其中的enc模組用VGG16bn[9]替換。(通過對VGG16bn、resnet50[10]和一個基於Inception[11]的特徵提取器進行實驗比較,發現vgg16bn是最好的支撐結構)
      2. 一個獨立的 解碼強化分支 (Decoding Reinforcement branch) 用於訓練,從而加快網路收斂,提升估計的密度圖 (density map)SSIM (Structural Similarity Index,結構相似度指數),也就是確保密度圖的區域性相關性;
      • 由此關注人群計數問題中的尺度變化問題,同時通過強化分支來降低背景噪聲,從而保留結構相似度、提升收斂性。
      • 結合DME和強化分支的優點,提出聯合損失函式:BCE (Binary Cross entropy loss)MSE (Mean Squared error loss),從而得到一個end-to-end的計數網路。
    • 分析:
      1. 分析當代網路架構的缺點,得出經驗性的結論:本文網路的效能提升主要受益於其中的 encoder-decoder 流水線結構。
      2. 通過一系列的誤差分析得出結論:當前的工作已然飽和,並提出一個待解決的問題: