小米開源FALSR演算法:快速精確輕量級的超解析度模型

AI科技大本營發表於2019-01-31

640?wx_fmt=jpeg


作者 | 周強(我愛計算機視覺)、劉暢

編輯 | Jane

出品 | AI科技大本營


這是來自小米最新出爐的論文,使用神經架構搜尋技術自動確定超解析度網路模型,取得了又快又好的效果,模型已開源,非常贊!


640?wx_fmt=png


摘要


深度卷積神經網路用於超解析度任務中取得了長足的進步。 之前的一系列研究集中於通過使用更深層的網路來改善評價指標峰值訊雜比(PSNR),而更多層往往意味著需要更多計算資料,這在計算資源有限的終端上並不容易應用。


為了設計能夠在邊緣裝置步驟的超解析度系統,需要在重建效能和模型的簡單性之間進行權衡,但這本身並不容易把握。 學界最近的一些研究工作正在努力人工實現平衡,而本文的工作則是通過神經架構搜尋自動實現相同的目標。


具體來說,本文采用多目標方法(反應模型效能的度量 PSNR,反應模型計算量的 mult-adds,和模型引數量)處理超解析度。 還提出了一種基於混合控制器的微觀和巨集觀層面的彈性搜尋策略,該控制器利用進化計算和強化學習方法提升模型效能。


實驗證明本文方法自動設計的模型在計算量可比較的模型中達到了最先進方法。


640?wx_fmt=png

SR的神經架構


640?wx_fmt=png

與state-of-the-art方法的精度比較


640?wx_fmt=png

在計算量可比較的模型中,該文提出的方法精度更高


論文地址:

https://arxiv.org/pdf/1901.07261v2.pdf


程式碼地址:

https://github.com/falsr/FALSR

可惜的是,官方並沒有公開訓練程式碼。


最近,神經架構搜尋研究和應用的論文越來越多,這是要替換掉演算法工程師的節奏,更有人斷言將來各種任務中最好的模型一定來自機器設計的模型!小米的這篇論文,在影像超分辨工程應用領域機器已經把演算法工程師比下去了!


更多學習


什麼是影像的超分辨重構技術(Super-Resolution)


影像的超分辨重構技術是指從一張或多張低解析度的影像中,重構出相應的高解析度影像。主要分為兩類,一是從單張低解析度影像中重建出高解析度影像。二是從多張低解析度影像中重建出高解析度影像。基於深度學習的SR,主要是基於單張影像的重構方法。其應用領域非常廣泛,涉及軍事、醫學、地理等。



超分辨重構和去噪、去網格、去模糊等問題是類似的。對於一張低分辨影像,可能會有多張高分辨影像與之對應,因此通常在求解高解析度影像時會加一個先驗資訊進行規範化約束。在傳統的方法中,通常會先學習這個先驗資訊。而基於深度學習的SR方法,則是通過神經網路直接進行從低分辨影像到高分辨影像的端到端的學習。


主要論文


  • Image Super-Resolution Using Deep Convolutional Networks


SRCNN(PAMI 2016)

http://mmlab.ie.cuhk.edu.hk/projects/SRCNN.html


  • 《Accurate Image Super-Resolution Using Very Deep Convolutional Networks》


VDSR(CVPR 2016)

https://github.com/huangzehao/caffe-vdsr


  • 《Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution》


LapSRN(CVPR 2017)

https://github.com/phoenix104104/LapSRN


  • 《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial》


SRGAN(CVPR oral 2017)

https://github.com/buriburisuri/SRGAN


  • 《Enhanced Deep Residual Networks for Single Image Super-Resolution》


EDSR(CVPR Workshop 2017)

https://github.com/thstkdgus35/EDSR-PyTorch


  • 《Residual Dense Network for Image Super-Resolution》


RDN(CVPR 2018)

https://github.com/yulunzhang/RDN


  • 《Image Super-Resolution Using Very Deep Residual Channel Attention Networks》


RCAN(ECCV 2018)

https://github.com/yulunzhang/RCAN


  • 《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》


ESRGAN(ECCV Workshop 2018)

https://github.com/xinntao/ESRGAN


更多解讀可參考:

https://blog.csdn.net/u012395979/article/details/85854893


(本文為 AI科技大本營整理文章,轉載請微信聯絡 1092722531 

推薦

640?wx_fmt=png

推薦閱讀

640?wx_fmt=png


相關文章