【生成對抗網路學習其一】經典GAN與其存在的問題和相關改進

dayceng發表於2022-06-10

原文網址 : https://www.cnblogs.com/DAYceng/p/16364564.html

參考資料：
1、https://github.com/dragen1860/TensorFlow-2.x-Tutorials
2、《Generative Adversarial Net》
直接介紹GAN可能不太容易理解，所以本次會順著幾個具體的問題討論並介紹GAN(個人理解有限，有錯誤的希望各位大佬指出)，本來想做程式碼介紹的，但是關於eriklindernoren的GAN系列實現已經有很多博主介紹過了，所以就不寫了。
如果你對GAN的基本知識不太瞭解，建議先看看莫煩的介紹：https://mofanpy.com/tutorials/machine-learning/gan/
注：圖片刷不出來可能需要fq，最近jsdelivr代理好像掛了。

1、什麼是GAN

GAN是一種生成網路

區別於以往使用的RNN、CNN等網路，GAN不是將資料與結果根據某種關係聯絡起來，而是使用一堆隨機數去生成想要的結果

GAN中同時訓練著兩個模型：一個是生成器（Generator），另一個是判別器（Discriminator）。

生成器通過隨機數來生成結果（有可能是圖片，也有可能是其他的），這裡我們把生成的結果稱為"生成資料"，我們的目標結果稱為"真實資料"。

之後，生成資料和真實資料會被同時送給判別器進行區分。

GAN的訓練

整體結構如下

2、GAN有什麼問題

研究資料的特點是解決問題的一個前提，資料分佈會直接影響到我們演算法的結果

對於“通過訓練，從噪聲資料生成一副圖片”這個問題來說，裡面涉及到兩種資料：噪聲和真實圖片

這兩種資料在分佈上來說是沒有重合部分的

例如，真實的圖片是“手寫數字1”，而還沒經過訓練的生成器用噪聲生成的圖片是類似老電視上的那種白色雪花噪點（我的理解，不知道恰不恰當）

顯然兩者不會有資料上的重合（overlapped），在這種情況下無論生成多少張圖片，我們人去看的時候總是能夠區分假圖片

具體來說就對應成下面的兩種分佈：P、Q

省略KL與JS的推導過程直接看結論：

當θ≠0（資料分佈沒有重合時），使用KL散度（相對熵）和JS散度不能夠很好地量化訓練結果

例如上圖，在均值達到某一大小時，兩者會變成固定常數（也就是不起作用，並且JS比KL出現時間更早），對應到現象就是出現梯度消失，沒辦法繼續更新梯度。

再換個角度看

藍色的是分佈1，紅色的是真實資料分佈，不管怎麼移動，只要兩者沒有重合，那麼JS永遠是log2（同一值）

也就是說，如果剛開始訓練時，資料分佈處於一個不好的狀態，那麼訓練很難再進行下去

再舉個例子

藍色是真實資料，綠色是生成資料的分佈，它們中間部分是沒有重疊的

對於橙色線也就是判別器而言，他可以簡單的區分出是或者不是真實資料（0/1）

但是如果一開始我們的資料分佈就處於綠色區域（不利位置），那麼是沒辦法進行判別的（無法更新）

而WGAN的評價標準（EM）可以解決這個問題，即使在不相交的位置，導數也可以起到引導作用

因此，使用EM距離來衡量訓練結果便是對GAN的一個重要改進

Wasserstein距離(Wasserstei Distance)（也叫EM距離，Earth-Mover Distance)可以用於衡量兩個分佈之間的距離

對於沒有重疊的分佈同樣適用，例如下面這種的

從橫軸可以看出，這兩個資料按照KL散度或者JS散度的標準，是完全沒有重疊的

現在將問題轉換一下，即使兩種分佈沒有重疊，但是我們還可以讓他們形式儘可能保持一致嘛

那麼我們就可以通過"交換"上面的柱狀體來實現這個目標

可以通過“交換次數”來衡量這個行為的效率

於是問題轉換成了：“從P分佈轉換到Q分佈需要幾步？”

轉換需要的“步數”就是代價，可以用來衡量P分佈與Q分佈到底有多相似

所以，即便是完全不重疊的分佈，無非就是轉換步驟很多而已，就說明他們非常不相關。

我們把柱形的移動轉換類比成“剷土”，那麼同樣是鏟，笨方法就鏟的次數多，好方法步數少，於是我們會針對每個情況去計算最優的“剷土方法”，用來衡量P與Q的相似度。

所以Wasserstein距離也叫“推土機距離”

計算式如下

可以看到，GAN中使用"D"來衡量分佈的接近程度

這個"D"其實就是一個使用JS散度構建的神經網路層（判別器層）

而WGAN中則是使用"f"來衡量分佈

"f"則是使用WD來構建的判別器層(因為WD原來是在離散情況下的，所以這裡在連續情況下使用相當於通過判別器來逼近理想的"f"，因此有約束條件)

但是有個約束條件：在f上取任意的兩個梯度x1、x2，他們的差必須小於1（圖中經過化簡了），即1-Lipschitz function

現在可以做個總結：

GAN與WGAN最主要的區別就是將JS散度換成Wasserstein距離(或者說EM距離)，由此解決了GAN早期訓練時因為資料重合（overlapped）度低而出現的梯度消失問題。

WGAN的訓練

整體結構如下

注意：經典GAN的生成器與編碼器均使用簡單的全連線層構建，而其他衍生種類GAN一般使用卷積層/反摺積層代替全連線層

3、WGAN有什麼問題

實現上面提到的設想的關鍵在於如何滿足1-Lipschitz約束

WGAN 為了實現這個約束，使用了 clip 截斷了判別器 weights

但這隻有在權重恰好合適時能夠實現（具體不推導了），並且這變相限制了這個網路的引數，進而約束了網路的表達能力。

在WGAN-gp論文中，它提到了WGAN使用clip方式所引發的問題。

重點看看下面的右邊（b）這張圖，很多顏色線條那個是隨著判別器層數增加， Clip 方案中梯度傳導是有問題的，要麼爆炸要麼消失了，而 Gradient penalty 方案可以讓每一層的梯度都比較穩定。

再來看看最右邊的圖， Clip 方案網路中 weights 引數都跑到的極端的地方，要麼最大，要麼最小，而 Gradient penalty 方案可以讓 weights 比較均勻地分佈。

WGAN-gp的訓練

【深度學習理論】通俗理解生成對抗網路GAN
2018-03-02
深度學習
【機器學習】李宏毅——生成式對抗網路GAN
2022-12-18
機器學習
GAN生成對抗網路-DCGAN原理與基本實現-深度卷積生成對抗網路03
2020-12-12
卷積
解讀生成對抗網路（GAN）之U-GAN-IT
2020-08-05
0901-生成對抗網路GAN的原理簡介
2021-05-08
萬字綜述之生成對抗網路（GAN）
2019-03-19
[深度學習]生成對抗網路的實踐例子
2020-10-26
深度學習
海量案例！生成對抗網路（GAN）的18個絕妙應用
2019-07-31
人工智慧-深度學習-生成模型：GAN經典模型--＞InfoGAN
2021-01-02
人工智慧深度學習模型
人工智慧-深度學習-生成模型：GAN經典模型--＞VAEGAN
2021-01-02
人工智慧深度學習模型
白話生成對抗網路 GAN，50 行程式碼玩轉 GAN 模型！【附原始碼】
2018-07-31
行程模型原始碼
生成對抗網路的進步多大，請看此文
2019-09-15
深度學習與圖神經網路學習分享：CNN 經典網路之-ResNet
2022-10-12
深度學習神經網路CNN
對抗網路學習記錄
2020-10-25
GAN實戰筆記——第六章漸進式增長生成對抗網路（PGGAN）
2022-03-06
筆記
音視訊學習 -- 弱網對抗技術相關實踐
2021-10-23
一文入門人工智慧的掌上明珠：生成對抗網路（GAN）
2020-08-03
人工智慧
GAN實戰筆記——第七章半監督生成對抗網路（SGAN）
2022-03-13
筆記
【強化學習】使用off-policy演算法機器人抓取任務基準；生成對抗網路 GAN 就是強化學習
2018-03-26
強化學習演算法機器人
神經網路進化能否改變機器學習？
2018-04-18
神經網路機器學習
GAN實戰筆記——第四章深度卷積生成對抗網路（DCGAN）
2022-02-23
筆記卷積
訓練生成對抗網路的一些技巧和陷阱
2019-11-04
第六週：生成式對抗網路
2020-09-12
網路表述學習經典論文——DeepWalk
2019-04-19
與堆和堆排序相關的問題
2022-11-28
排序
實戰生成對抗網路[1]：簡介
2018-10-20
LSGAN：最小二乘生成對抗網路
2018-10-10
深度學習——使用卷積神經網路改進識別鳥與飛機模型
2023-04-08
深度學習卷積神經網路模型
吳恩達Deeplearning.ai國慶節上新：生成對抗網路（GAN）專項課程
2020-10-09
吳恩達AI
基於深度神經網路的人臉識別相關問題
2024-05-30
神經網路
獨家 | GAN大盤點，聊聊這些年的生成對抗網路 : LSGAN, WGAN, CGAN, infoGAN, EBGAN, BEGAN, VAE
2018-07-20
網路、HTTP相關學習總結
2019-03-22
HTTP
深度學習經典卷積神經網路之AlexNet
2020-04-06
深度學習卷積神經網路
深度學習從入門到進階的12個經典問題及解答
2019-02-27
深度學習
實戰生成對抗網路[2]：生成手寫數字
2019-02-27
卷積生成對抗網路（DCGAN）---生成手寫數字
2020-06-06
卷積
VsCode相對路徑的問題
2020-10-05
VSCode
從經典結構到改進方法，神經網路語言模型綜述
2019-07-23
神經網路模型

【生成對抗網路學習 其一】經典GAN與其存在的問題和相關改進