小米開源FALSR演算法:快速精確輕量級的超解析度模型
作者 | 周強(我愛計算機視覺)、劉暢
編輯 | Jane
出品 | AI科技大本營
這是來自小米最新出爐的論文,使用神經架構搜尋技術自動確定超解析度網路模型,取得了又快又好的效果,模型已開源,非常贊!
摘要
深度卷積神經網路用於超解析度任務中取得了長足的進步。 之前的一系列研究集中於通過使用更深層的網路來改善評價指標峰值訊雜比(PSNR),而更多層往往意味著需要更多計算資料,這在計算資源有限的終端上並不容易應用。
為了設計能夠在邊緣裝置步驟的超解析度系統,需要在重建效能和模型的簡單性之間進行權衡,但這本身並不容易把握。 學界最近的一些研究工作正在努力人工實現平衡,而本文的工作則是通過神經架構搜尋自動實現相同的目標。
具體來說,本文采用多目標方法(反應模型效能的度量 PSNR,反應模型計算量的 mult-adds,和模型引數量)處理超解析度。 還提出了一種基於混合控制器的微觀和巨集觀層面的彈性搜尋策略,該控制器利用進化計算和強化學習方法提升模型效能。
實驗證明本文方法自動設計的模型在計算量可比較的模型中達到了最先進方法。
SR的神經架構
與state-of-the-art方法的精度比較
在計算量可比較的模型中,該文提出的方法精度更高
論文地址:
https://arxiv.org/pdf/1901.07261v2.pdf
程式碼地址:
https://github.com/falsr/FALSR
可惜的是,官方並沒有公開訓練程式碼。
最近,神經架構搜尋研究和應用的論文越來越多,這是要替換掉演算法工程師的節奏,更有人斷言將來各種任務中最好的模型一定來自機器設計的模型!小米的這篇論文,在影像超分辨工程應用領域機器已經把演算法工程師比下去了!
更多學習
什麼是影像的超分辨重構技術(Super-Resolution)
影像的超分辨重構技術是指從一張或多張低解析度的影像中,重構出相應的高解析度影像。主要分為兩類,一是從單張低解析度影像中重建出高解析度影像。二是從多張低解析度影像中重建出高解析度影像。基於深度學習的SR,主要是基於單張影像的重構方法。其應用領域非常廣泛,涉及軍事、醫學、地理等。
超分辨重構和去噪、去網格、去模糊等問題是類似的。對於一張低分辨影像,可能會有多張高分辨影像與之對應,因此通常在求解高解析度影像時會加一個先驗資訊進行規範化約束。在傳統的方法中,通常會先學習這個先驗資訊。而基於深度學習的SR方法,則是通過神經網路直接進行從低分辨影像到高分辨影像的端到端的學習。
主要論文
《Image Super-Resolution Using Deep Convolutional Networks》
SRCNN(PAMI 2016)
http://mmlab.ie.cuhk.edu.hk/projects/SRCNN.html
《Accurate Image Super-Resolution Using Very Deep Convolutional Networks》
VDSR(CVPR 2016)
https://github.com/huangzehao/caffe-vdsr
《Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution》
LapSRN(CVPR 2017)
https://github.com/phoenix104104/LapSRN
《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial》
SRGAN(CVPR oral 2017)
https://github.com/buriburisuri/SRGAN
《Enhanced Deep Residual Networks for Single Image Super-Resolution》
EDSR(CVPR Workshop 2017)
https://github.com/thstkdgus35/EDSR-PyTorch
《Residual Dense Network for Image Super-Resolution》
RDN(CVPR 2018)
https://github.com/yulunzhang/RDN
《Image Super-Resolution Using Very Deep Residual Channel Attention Networks》
RCAN(ECCV 2018)
https://github.com/yulunzhang/RCAN
《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》
ESRGAN(ECCV Workshop 2018)
https://github.com/xinntao/ESRGAN
更多解讀可參考:
https://blog.csdn.net/u012395979/article/details/85854893
(本文為 AI科技大本營整理文章,轉載請微信聯絡 1092722531。)
推薦推薦閱讀
相關文章
- Spring 5| 輕量級的開源JavaEE框架SpringJava框架
- 輕量級超級 css 工具CSS
- SphinxJS——把字串編碼成png圖片的超輕量級開源庫JS字串編碼
- Midori:輕量級開源 Web 瀏覽器Web瀏覽器
- 推薦一個Star超過2K的.Net輕量級的CMS開源專案
- 8.6M超輕量中英文OCR模型開源,訓練部署一條龍模型
- looter——超輕量級爬蟲框架爬蟲框架
- Oracle釋出開源的輕量級 Java 微服務框架 HelidonOracleJava微服務框架
- LambdaToSql(輕量級ORM) 入門篇 開源專案SQLORM
- docker快速建立輕量級的可移植的容器(一)Docker
- 開源輕量級 IM 框架 MobileIMSDK v6.1.2 釋出!框架
- lit Web元件:構建快速、輕量級的 Web 元件Web元件
- 輕量級模型設計與部署總結模型
- 輕量級超級簡單的element的layout柵格化佈局
- 阿里開源!輕量級深度學習端側推理引擎 MNN阿里深度學習
- 如何快速精確的和leader溝通
- Lite Actor:方舟Actor併發模型的輕量級優化模型優化
- 開源輕量級 IM 框架 MobileIMSDK 的微信小程式端已釋出!框架微信小程式
- 開源一個基於dotnet standard的輕量級的ORM框架-Light.DataORM框架
- Dendron:VSCode中超快速的開源筆記VSCode筆記
- 滴滴開源 DroidAssist : 輕量級 Android 位元組碼編輯外掛Android
- 小米AI團隊新成果,AutoML完爆超解析度AITOML
- 推薦一套輕量級的開源圖床系統:Light Fast Picture圖床AST
- 開源推薦:一款輕量級、高效能的電商系統
- 超輕量級MP4封裝方法介紹封裝
- 阿里巴巴開源輕量級深度神經網路推理引擎MNN阿里神經網路
- Orillusion 引擎正式開源!AIGC 時代下的 WebGPU 輕量級 3D 渲染引擎!AIGCWebGPU3D
- Spring的輕量級實現Spring
- 開源輕量級辦公系統Sandbox介紹以及配套開發文件連載
- DevOps專題|Lua引擎打造超輕量級客戶端dev客戶端
- 完全私有化部署!一款開源輕量級網站防火牆!網站防火牆
- 精選 | 6款超讚的最新AI開源專案!AI
- [Hacker News 週報] 超輕量級 Python 引擎;快速閱讀英文外掛;TypeScript 釋出新版本PythonTypeScript
- Facebook開源演算法程式碼庫PySlowFast,輕鬆復現前沿視訊理解模型演算法AST模型
- 四個超級實用的Android開源庫!Android
- Facebook開源Hermes:輕量JavaScript優化引擎JavaScript優化
- HTTPSQS:基於 HTTP協議的輕量級開源簡單訊息佇列服務HTTP協議佇列
- 宜信開源專注業務邏輯的輕量級服務框架nextsystem4框架