文章學習29“Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning”

weixin_33670713發表於2018-10-08

原文網址 : https://blog.csdn.net/weixin_33670713/article/details/86995886

這篇文章是CVPR2018年的作品，商湯科技出品。總得來說這篇文章在效能上並沒有什麼提示，但是把網路輕量化了，減少為原來1/3的引數量，還用了強化學習的策略。在這篇文章裡，作者認為真實的需要恢復的影象被進行了模糊，噪聲和JPEG壓縮三個步驟，所以在影象恢復時也考慮這三個處理過程並且將其分開，分成不同的小步驟依次進行處理。

作者在進行實驗時發現不同的小過程的處理級別和步驟會對最後的結果產生很大的影響，比如下圖，不同顏色是不同處理級別，相比於c來說，不同的處理方式、步驟、級別都會對最後的處理結果產生很大影響。所以在處理策略上需要下功夫。

整個網路就由兩部分組成，一個是完成各種影象恢復作用的工具箱，另一個就是一個迴圈結構的agent，用以在每個階段選擇哪個工具。

1）工具箱。本文提出的工具箱中包含了12個針對不同降質型別的CNN。每一種工具解決一種特定程度的高斯模糊、高斯噪聲、JPEG失真，這些失真在影象復原領域中最為常見。針對輕微程度失真的復原工具CNN僅有3層，而針對嚴重程度失真的工具達到8層。為了增強復原工具的魯棒性，本文在所有工具的訓練資料中均加入了輕微的高斯噪聲及JPEG失真。

2）準備好工具箱之後就是怎麼使用這些工具的演算法了，作者在這裡採用了強化學習的策略，將psnr的增值作為獎勵進行訓練，具體過程如上圖。作者花了很大的篇幅解釋了文章所用名詞的含義。比如“動作”，是指在每一個影象恢復步驟中採取的工具的這個過程，因為本文中有12（上表）個工具，所以每一個步驟就有13（12+停止）個動作；“回報”就是指的強化學習裡的reward，這裡採用的是psnr的增益。

網路結構就如上圖所示，在每一個步驟裡都需要有一個agent用來判斷應該使用toolbox裡的哪一個，agent由三部分組成：特徵提取器（Feature Extractor），包含了4個卷積層和1個全連線層，將輸入影象轉化為32維特徵向量；One-hot編碼器（One-hot Encoder），其輸入是前一步驟的動作估值向量，輸出將其轉換為對應的特徵向量；LSTM，其以前兩個模組輸出作為輸入，這個模組不僅觀測當前步驟的狀態特徵，還儲存了歷史狀態的資訊，該模組最後輸出當前步驟的估值向量，用於復原工具的選取。就這樣影象一步步的傳輸下去，經過幾個步驟之後遇到停止動作時即停止影象恢復。但在本文作者設定了一個最大傳輸步驟，即到達這個步驟之後即使沒有停止動作也停止訓練。

整個訓練過程是一個端到端的過程，演算法如下：

對於每一張輸入影象，先通過所選取的工具鏈前向傳播得到最後的復原影象，通過與清晰參考影象對比得到MSE損失，然後通過工具鏈對誤差進行反向傳播，根據平均的梯度值更新工具網路的引數。

實驗：使用DIV2K訓練集的前750張影象用於訓練，後50張影象用於測試。通過摳取解析度為63x63的子影象，共得到25萬張訓練影象和3,584張測試影象。訓練時在每一張影象上隨機加上不同程度的高斯模糊、高斯噪聲和JPEG壓縮。演算法在訓練樣本中排除一些極度輕微或嚴重的失真，使用中度失真的影象進行訓練，而在輕度、中度和重度失真的影象上進行測試。測試結果如下：

和VDSR和DnCNN在影象恢復上進行對比，引數少了2/3，但效能仍有提升。（VDSR-s指和RL-Restore同樣引數量的VDSR）

在真實影象上的實驗結果如下圖所示，顯示本文所提出的方法比VDSR效果要好

Join Query Optimization with Deep Reinforcement Learning Algorithms
2020-12-27
Go
《DEEP LEARNING·深度學習》
2024-05-05
深度學習
深度學習（Deep Learning）
2022-08-17
深度學習
論文閱讀翻譯之Deep reinforcement learning from human preferences
2024-09-11
深度學習 DEEP LEARNING 學習筆記（一）
2020-07-24
深度學習筆記
深度學習 DEEP LEARNING 學習筆記（二）
2020-07-24
深度學習筆記
《深度學習》PDF Deep Learning: Adaptive Computation and Machine Learning series
2019-12-17
深度學習APTMac
吳恩達機器學習第三課 Unsupervised learning recommenders reinforcement learning
2024-06-10
吳恩達機器學習
深度學習（Deep Learning）優缺點
2020-02-23
深度學習
Reinforcement Learning Basic Notes
2024-04-28
貝葉斯深度學習（bayesian deep learning）
2019-01-17
深度學習
深度學習模型調優方法（Deep Learning學習記錄）
2020-08-05
深度學習模型
Reinforcement Learning Chapter2
2024-02-05
APT
ARS Reinforcement Learning using Gymnasium
2024-11-20
Enhancing Diffusion Models with Reinforcement Learning
2024-07-24
Searching with Deep Learning 深度學習的搜尋應用
2019-04-16
深度學習
顯示卡不是你學習 Deep Learning 的藉口
2021-12-19
論文閱讀《Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising》
2024-04-07
CNN
Papers of Multi Agent Reinforcement Learning(MARL)
2018-08-06
【深度學習】大牛的《深度學習》筆記，Deep Learning速成教程
2018-04-07
深度學習筆記
強化學習(Reinforcement Learning)中的Q-Learning、DQN，面試看這篇就夠了！
2019-08-18
強化學習面試
林軒田機器學習技法課程學習筆記13 — Deep Learning
2018-07-29
機器學習筆記
Deep learning - note 1
2018-11-01
Deep Learning with Differential Privacy
2024-04-09
強化學習（九）Deep Q-Learning進階之Nature DQN
2018-10-08
強化學習
Restormer Efficient Transformer for High-Resolution Image Restoration——2022CVPR
2024-05-22
RESTORM
Jan 2023-Prioritizing Samples in Reinforcement Learning with Reducible Loss
2023-05-17
剛剛，阿里開源首個深度學習框架 X-Deep Learning！
2018-12-21
阿里深度學習框架
遷移學習（JDDA）《Joint domain alignment and discriminative feature learning for unsupervised deep domain adaptation》
2023-01-12
遷移學習AIAPT
深度互學習-Deep Mutual Learning：三人行必有我師
2019-07-31
Machine Learning Mastery 部落格文章翻譯：深度學習與 Keras
2019-04-11
MacAST深度學習Keras
遷移學習《Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks》
2023-04-06
遷移學習
Manning.Deep.Learning.with.Python.2017.11.pdf
2018-10-09
Python
COMP9444 Neural Networks and Deep Learning
2024-06-21
DEEP LEARNING WITH PYTORCH: A 60 MINUTE BLITZ | TENSORS
2022-01-19
PyTorch
《深度學習入門：基於Python的理論與實現》 Deep Learning from Scratch
2019-12-17
深度學習Python
【Coursera GenAI with LLM】 Week 3 Reinforcement Learning from Human Feedback Class Notes
2024-03-15
AI
為什麼有些學數學的看不慣甚至鄙視 Deep Learning？
2020-07-17

文章學習29“Crafting a Toolchain for Image Restoration by Deep Reinforcement Learning”

相關文章