NOISEDIFFUSION: 改進基於擴散模型的球面線性插值

zhaihaotian發表於2024-05-02

Motivation :
1.改進自然影像的插值質量：現有的影像插值方法，尤其是那些基於擴散模型的方法，通常在處理非模型生成的自然影像時遇到困難。這些方法往往不能有效地處理自然影像中的複雜和多樣的噪聲分佈，導致插值結果不自然或有明顯的影像偽影。
2.處理編碼噪聲的無效性：在影像插值過程中，影像首先被編碼到一個噪聲空間，然後透過去噪技術恢復。然而，如果編碼的噪聲不符合預期的噪聲分佈（例如正態分佈），這個基礎假設的破壞會導致插值過程中的問題，比如影像質量下降或者細節丟失。
3.提高訊雜比和減少資訊損失：傳統方法在引入噪聲以匹配預期分佈的過程中，可能會降低影像的訊雜比，從而損失重要的影像資訊。NoiseDiffusion方法透過在噪聲影像空間進行插值，並將原始影像資料注入到噪聲影像中，旨在解決這一資訊損失問題。

在DDIM中其實還有兩個小點：重建與插值不過 DDIM中的插值是對由擴散模型生成之後的影像做的插值然而，當將其擴充套件到自然影像時，插值結果的質量可能未達到預期，並且經常引入偽影也就是論文中的Figure1的中間的生成效果

作者認為產生不優的結果的原因是編碼噪聲不遵守預期的正態分佈並可能包含高於或低於去噪閾值的噪聲成分，導致最終插值影像中出現偽影。

根據圖3中展示的結果，我們觀察到，新增與去噪水平匹配的高斯噪聲可以產生高質量的影像。然而，當噪聲水平超過去噪閾值時，生成的影像中會引入額外的偽影。相反，當噪聲水平低於去噪閾值時，結果影像看起來有些模糊，伴隨著明顯的特徵丟失。

隨後作者提出了定理1 並基於定理一將球面線性影像插值的失敗歸咎於噪聲水平和去噪閾值之間的不匹配。自然影像包含了模型之前未曾遇到的許多特徵。因此，潛在變數不遵循預期的正態分佈，並可能包含高於或低於去噪閾值的噪聲成分，導致去噪後影像質量低下。

一種直觀的方式是直接向影像中新增與預定去噪閾值匹配的高斯噪聲。這樣做可以確保影像的噪聲水平適合模型的處理能力，從而在去噪時保持影像質量。

4.3介紹了一種結合了SDEdit的影像插值方法。當給定兩幅影像時，該方法首先在同一水平上為它們每一幅新增高斯噪聲。接下來，我們使用球面線性插值，並隨後進行去噪處理。

但是由於這種影像插值方法基於SDEdit，它不可避免地繼承了SDEdit方法的缺點，如圖4所示。

圖4中呈現的插值結果表明，該方法可以處理影像質量差的問題。然而，當我們新增更多高斯噪聲並去噪時，插值的影像在保持原始風格的同時，表現出類似於直接影像疊加的現象。相反，選擇較少的高斯噪聲並去噪，雖然確保了影像的真實性，但引入了額外資訊，最終導致插值失敗。

所以作者提出了noise diffusion ：給定兩幅影像，我們首先透過將它們編碼到潛在空間並剪下以抑制極端值的噪聲來開始，然後我們將潛在變數與高斯噪聲結合，並且結合這些與原始影像，最後應用剪下和去噪來產生插值結果

剪下的方法則是使用了68-95-99.7規則
如果畫素值大於邊界值，則設為邊界值。
如果畫素值小於負邊界值，則設為負邊界值。
否則，保持畫素值不變。

隨後作者證明了球面線性插值和引入噪音的線性插值其實是noisediffusion的一種特殊情況

最後實驗部分介紹了幾種引數的影響以及在什麼時候做邊界控制

總的來說提出了一種新的方法該方法克服了球面線性插值的侷限性。該方法建立了一個統一框架，結合了球面線性插值和直接引入噪聲用於插值的方法的優點。此外，透過對噪聲施加邊界控制並補充原始影像資訊，有效地應對了噪聲水平超出或低於去噪閾值所帶來的挑戰。透過對潛在變數的修正，實現了更優的插值效果。

ICLR 2024 Spotlight | NoiseDiffusion: 矯正擴散模型噪聲，提高插值圖片質量
2024-05-06
ICLR模型
scala實現球面插值（Slerp）
2018-08-30
基於TRE文章的非線性模型化線性方法
2023-10-04
模型
繞過直接數值模擬或實驗，生成擴散模型用於湍流研究
2024-05-20
模型
[work] 影象縮放——雙線性插值演算法
2019-01-20
演算法
介紹一種二維線性插值計算方法
2021-03-17
一文詳解擴散模型：DDPM
2023-03-29
模型
屬性動畫-波紋擴散WaveView
2019-01-07
動畫View
羅傑斯的創新擴散模型(轉載)
2007-07-28
模型
離散漸進模型(轉載)
2007-07-27
模型
影象縮放的雙線性內插值演算法的原理解析
2013-03-19
演算法
基於Matlab的BP神經網路分段插值模擬
2014-03-18
Matlab神經網路
【diffusion】擴散模型詳解！理論＋程式碼
2024-03-12
模型
一鍵Run帶你體驗擴散模型的魅力
2024-03-08
模型
關於分類的線性模型的討論
2020-07-22
模型
影像重取樣演算法之雙線性插值演算法
2020-01-30
演算法
演算法-查詢（線性、二分、插值、斐波那契）
2020-10-04
演算法
圖形影象處理－之－高質量的快速的影象縮放中篇二次線性插值和三次卷積插值
2013-07-10
卷積
怎麼理解今年 CV 比較火的擴散模型（DDPM）？
2024-03-12
模型
為什麼擴散diffution模型如此強大？ - Reddit
2022-04-21
模型
DiT：Transformers 與擴散模型強強聯手
2023-01-16
ORM模型
擴散模型 (Diffusion Model) 之最全詳解圖解
2024-03-12
模型圖解
如何改進手上的機器學習模型
2017-07-13
機器學習模型
opencv中自定義的雙線性二次插值的影像旋轉及縮放
2024-05-02
OpenCV
MIT新開發的 AI 模型有望改進惡性腦瘤治療
2018-08-14
MITAI模型
世界模型也擴散！訓練出的智慧體竟然不錯
2024-05-24
世界模型智慧體
Diffusion Model 擴散模型-[通俗易懂+程式碼講解
2024-03-12
模型
SCSS #{} 插值
2019-02-22
CSS
資訊化基礎的最小熵值的散點聚集
2011-02-16
熵
基於畢昇上線基於大模型對應服務
2024-04-24
大模型
jquery改變元素屬性值
2017-11-07
jQuery
R語言用線性模型進行臭氧預測：加權泊松迴歸，普通最小二乘，加權負二項式模型，多重插補缺失值|附程式碼資料
2023-09-27
R語言模型
HOG演算法中用到三線性插值（Trilinear Interpolation）的作用及其用法
2020-11-12
HOG演算法
基於ERP的傳統財務流程改進研究
2011-03-26
二、插值操作
2021-01-03
MATLAB插值
2017-11-21
Matlab
PRML 迴歸的線性模型
2022-03-01
模型
值得你花時間看的擴散模型教程，來自普渡大學
2024-04-06
模型

NOISEDIFFUSION: 改進基於擴散模型的球面線性插值

相關文章