W-Net: Reinforced U-Net for Density Map Estimation
I. Introduction
- 本文貢獻:
- 演算法:
- 一個基於U-Net的 DME (密度圖估計,density map estimation) 模型。
- 該模型採用了完全相同的encoder-decoder流水線結構,外加一個強化分支。其中的enc模組用VGG16bn[9]替換。(通過對VGG16bn、resnet50[10]和一個基於Inception[11]的特徵提取器進行實驗比較,發現vgg16bn是最好的支撐結構)。
- 一個獨立的 解碼強化分支 (Decoding Reinforcement branch) 用於訓練,從而加快網路收斂,提升估計的密度圖 (density map) 的 SSIM (Structural Similarity Index,結構相似度指數),也就是確保密度圖的區域性相關性;
- 由此關注人群計數問題中的尺度變化問題,同時通過強化分支來降低背景噪聲,從而保留結構相似度、提升收斂性。
- 結合DME和強化分支的優點,提出聯合損失函式:BCE (Binary Cross entropy loss) 和 MSE (Mean Squared error loss),從而得到一個end-to-end的計數網路。
- 分析:
- 分析當代網路架構的缺點,得出經驗性的結論:本文網路的效能提升主要受益於其中的 encoder-decoder 流水線結構。
- 通過一系列的誤差分析得出結論:當前的工作已然飽和,並提出一個待解決的問題: