變分（圖）自編碼器不能直接應用於下游任務（GAE, VGAE, AE, VAE and SAE）

zyx423發表於2020-06-09

原文網址 : https://www.cnblogs.com/zyx423/p/13081135.html

自編碼器是無監督學習領域中一個非常重要的工具。最近由於圖神經網路的興起，圖自編碼器得到了廣泛的關注。筆者最近在做相關的工作，對科研工作中經常遇到的：自編碼器（AE），變分自編碼器（VAE），圖自編碼器（GAE）和圖變分自編碼器（VGAE）進行了總結。如有不對之處，請多多指正。
另外，我必須要強調的一點是：很多文章在比較中將自編碼器和變分自編碼器視為一類，我個人認為，這二者的思想完全不同。自編碼器的目的不是為了得到latent representation（中間層），而是為了生成新的樣本。我自己的實驗得出的結論是，變分自編碼器和變分圖自編碼器生成的中間層不能直接用來做下游任務（聚類、分類等），這是一個坑。

自編碼器（AE）

在解釋圖自編碼器之前，首先理解下什麼是自編碼器。自編碼器的思路來源於傳統的PCA，其目的可以理解為非線性降維。我們知道在傳統的PCA中，學習器學得一個子空間矩陣，將原始資料投影到一個低維子空間，從未達到資料降維的目的。自編碼器則是利用神經網路將資料逐層降維，每層神經網路之間的啟用函式就起到了將"線性"轉化為"非線性"的作用。自編碼器的網路結構可以是對稱的也可以是非對稱的。我們下面以一個簡單的四層對稱的自編碼器為例，全文程式碼見最後。
(嚴格的自編碼器是隻有一個隱藏層，但是我在這裡做了個擴充，其最大的區別就是隱藏層以及神經元數量的多少，理解一個，其它的都就理解了。)

圖自編碼器（GAE）

圖自編碼器和自編碼器最大的區別有兩點：一是圖自編碼器在encoder過程中使用了一個 \(n*n\) 的卷積核；另一個是圖自編碼器沒有資料解碼部分，轉而代之的是圖解碼（graph decoder),具體實現是前後鄰接矩陣的變化做loss。
圖自編碼器可以像自編碼器那樣用來生成隱向量，也可以用來做鏈路預測（應用於推薦任務）。

變分自編碼器（VAE）

變分自編碼是讓中間層Z服從一個分佈。這樣我們想要生成一個新的樣本的時候，就可以直接在特定分佈中隨機抽取一個樣本。另外，我初學時遇到的疑惑，就是中間層是怎麼符合分佈的。我的理解是：
輸入樣本：\(\mathbf{X \in \mathcal{R}^{n * d}}\)
中間層：\(\mathbf{Z \in \mathcal{R}^{n * m}}\)
所謂的正態分佈是讓\(Z\)的每一行\(z_i\)符合正態分佈，這樣才能隨機從正態分佈中抽一個新的\(z_i\)出來。但是正是這個原因，我認為\(Z\)不能直接用來處理下游任務（分類、聚類）,我自己的實驗確實效果不好。

變分圖自編碼器（VGAE）

如果你理解了變分比編碼器和圖自編碼器，那麼變分圖自編碼器你也就能理解了。第一個改動就是在VAE的基礎上把encoder過程換成了GCN的卷積過程，另一個改動就是把decoder過程換成了圖decoder過程。同樣生成的中間層隱向量不能直接應用下游任務。
資料集和下游任務的程式碼見: https://github.com/zyx423/GAE-and-VGAE.git

全文程式碼如下：

class myAE(torch.nn.Module):
     
    def __init__(self, d_0, d_1, d_2, d_3, d_4):
        super(myAE, self).__init__()
        // 這裡的d0, d_1, d_2, d_3, d_4對應四層神經網路的維度
    
        self.conv1 = torch.nn.Sequential(
            torch.nn.Linear(d_0, d_1, bias=False),
            torch.nn.ReLU(inplace=True)
        )

        self.conv2 = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False),
            torch.nn.ReLU(inplace=True)
        )

        self.conv3 = torch.nn.Sequential(
            torch.nn.Linear(d_2, d_3, bias=False),
            torch.nn.ReLU(inplace=True)
        )

        self.conv4 = torch.nn.Sequential(
            torch.nn.Linear(d_3, d_4, bias=False),
            torch.nn.Sigmoid()
        )
    def Encoder(self, H_0):
        H_1 = self.conv1(H_0)
        H_2 = self.conv2(H_1)
        return H_2

    def Decoder(self, H_2):
        H_3 = self.conv3(H_2)
        H_4 = self.conv4(H_3)
        return H_4

    def forward(self, H_0):
        Latent_Representation = self.Encoder(H_0)
        Features_Reconstrction = self.Decoder(Latent_Representation)
        return Latent_Representation, Features_Reconstrction

class myGAE(torch.nn.Module):
    def __init__(self, d_0, d_1, d_2):
        super(myGAE, self).__init__()

        self.gconv1 = torch.nn.Sequential(
            torch.nn.Linear(d_0, d_1, bias=False),
            torch.nn.ReLU(inplace=True)
        )
        self.gconv1[0].weight.data = get_weight_initial(d_1, d_0)

        self.gconv2 = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False)
        )
        self.gconv2[0].weight.data = get_weight_initial(d_2, d_1)

    def Encoder(self, Adjacency_Modified, H_0):
        H_1 = self.gconv1(torch.matmul(Adjacency_Modified, H_0))
        H_2 = self.gconv2(torch.matmul(Adjacency_Modified, H_1))
        return H_2

    def Graph_Decoder(self, H_2):
        graph_re = Graph_Construction(H_2)
        Graph_Reconstruction = graph_re.Middle()
        return Graph_Reconstruction


    def forward(self, Adjacency_Modified, H_0):
        Latent_Representation = self.Encoder(Adjacency_Modified, H_0)
        Graph_Reconstruction = self.Graph_Decoder(Latent_Representation)
        return Graph_Reconstruction, Latent_Representation

class myVAE(torch.nn.Module):
    def __init__(self, d_0, d_1, d_2, d_3, d_4, bias=False):
        super(myVAE, self).__init__()

        self.conv1 = torch.nn.Sequential\
        (
            torch.nn.Linear(d_0, d_1, bias= False),
            torch.nn.ReLU(inplace=True)
        )

        # VAE有兩個encoder，一個用來學均值，一個用來學方差
        self.conv2_mean = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False)

        )
        self.conv2_std = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False)
        )
        self.conv3 = torch.nn.Sequential(
            torch.nn.Linear(d_2, d_3, bias=False),
            torch.nn.ReLU(inplace=False)
        )
        self.conv4 = torch.nn.Sequential(
            torch.nn.Linear(d_3, d_4, bias=False),
            torch.nn.Sigmoid()
        )

    def Encoder(self, H_0):
        H_1 = self.conv1(H_0)
        H_2_mean = self.conv2_mean(H_1)
        H_2_std = self.conv2_std(H_1)
        return H_2_mean, H_2_std

    def Reparametrization(self, H_2_mean, H_2_std):
        # sigma = 0.5*exp(log(sigma^2))= 0.5*exp(log(var))
        std = 0.5 * torch.exp(H_2_std)
        # N(mu, std^2) = N(0, 1) * std + mu。
        # 數理統計中的正態分佈方差，剛學過， std是方差。
        # torch.randn 生成正態分佈
        Latent_Representation = torch.randn(std.size()) * std + H_2_mean
        return Latent_Representation

    # 解碼隱變數
    def Decoder(self, Latent_Representation):
        H_3 = self.conv3(Latent_Representation)
        Features_Reconstruction = self.conv4(H_3)
        return Features_Reconstruction

    # 計算重構值和隱變數z的分佈引數
    def forward(self, H_0):
        H_2_mean, H_2_std = self.Encoder(H_0)
        Latent_Representation = self.Reparametrization(H_2_mean, H_2_std)
        Features_Reconstruction = self.Decoder(Latent_Representation)
        return Latent_Representation, Features_Reconstruction, H_2_mean, H_2_std

class myVGAE(torch.nn.Module):
    def __init__(self, d_0, d_1, d_2):
        super(myVGAE, self).__init__()

        self.gconv1 = torch.nn.Sequential(
            torch.nn.Linear(d_0, d_1, bias=False),
            torch.nn.ReLU(inplace=True)
        )
        # self.gconv1[0].weight.data = get_weight_initial(d_1, d_0)

        self.gconv2_mean = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False)
        )
        # self.gconv2_mean[0].weight.data = get_weight_initial(d_2, d_1)

        self.gconv2_std = torch.nn.Sequential(
            torch.nn.Linear(d_1, d_2, bias=False)
        )
        # self.gconv2_std[0].weight.data = get_weight_initial(d_2, d_1)

    def Encoder(self, Adjacency_Modified, H_0):
        H_1 = self.gconv1(torch.matmul(Adjacency_Modified, H_0))
        H_2_mean = self.gconv2_mean(torch.matmul(Adjacency_Modified, H_1))
        H_2_std = self.gconv2_std(torch.matmul(Adjacency_Modified, H_1))
        return H_2_mean, H_2_std

    def Reparametrization(self, H_2_mean, H_2_std):

        # sigma = 0.5*exp(log(sigma^2))= 0.5*exp(log(var))
        std = 0.5 * torch.exp(H_2_std)
        # N(mu, std^2) = N(0, 1) * std + mu。
        # 數理統計中的正態分佈方差，剛學過， std是方差。
        # torch.randn 生成正態分佈
        Latent_Representation = torch.randn(std.size()) * std + H_2_mean
        return Latent_Representation

    # 解碼隱變數
    def Graph_Decoder(self, Latent_Representation):
        graph_re = Graph_Construction(Latent_Representation)
        Graph_Reconstruction = graph_re.Middle()
        return Graph_Reconstruction

    def forward(self, Adjacency_Modified, H_0):
        H_2_mean, H_2_std = self.Encoder(Adjacency_Modified, H_0)
        Latent_Representation = self.Reparametrization(H_2_mean, H_2_std)
        Graph_Reconstruction = self.Graph_Decoder(Latent_Representation)
        return Latent_Representation, Graph_Reconstruction, H_2_mean, H_2_std

VAE變分自編碼器
2022-01-20
變分自編碼器VAE（上）
2020-04-06
變分自編碼器（五）：VAE + BN = 更好的VAE
2024-07-08
快速瞭解變分自編碼器 VAE
2024-03-25
變分自編碼器（七）：球面上的VAE（vMF-VAE）
2024-07-08
變分自編碼器VAE：一步到位的聚類方案
2018-09-18
聚類
變分自編碼器（六）：從幾何視角來理解VAE的嘗試
2024-07-08
圖自編碼器的起源和應用
2020-03-10
變分貝葉斯自編碼器
2020-04-06
漫談概率 PCA 和變分自編碼器
2018-08-16
PCA
CNN，GAN，AE和VAE概述
2019-03-03
CNN
【機器學習】李宏毅——AE自編碼器(Auto-encoder)
2022-12-20
機器學習
變分自編碼器（二）：從貝葉斯觀點出發
2024-07-08
分類任務loss不變
2020-11-27
新型掩碼自編碼器 AdaMAE，自適應取樣
2023-02-22
機器學習--分類變數編碼方法
2020-10-01
機器學習變數
SAE自動駕駛分級介紹
2024-03-13
自動駕駛
用於影像降噪的卷積自編碼器 | 視覺進階
2019-12-20
卷積視覺
自編碼器AE全方位探析：構建、訓練、推理與多平臺部署
2023-10-27
[文件教程]解決sae下編輯器圖片上傳問題
2019-05-11
用深度卷積自編碼器在10分鐘內降低影像噪聲
2020-10-06
卷積
自動編碼器
2020-04-06
哈佛大學提出變分注意力：用VAE重建注意力機制
2018-07-26
北大博士生提出CAE，下游任務泛化能力優於何愷明MAE
2022-02-23
SAM已經Out了！TS-SAM：適應下游任務的分割一切！
2024-08-18
SAE 的極致應用部署效率
2020-10-21
MeterSphere 介面自動化測試應用實踐 - 定時任務構建機器人
2024-05-21
機器人
本地圖文直接複製到HTML編輯器中
2020-11-13
地圖HTML
SD中的VAE,你不能不懂
2024-07-03
使用gulp編寫常用自動化構建任務
2018-09-28
寶塔兩種方式編寫 crontab 自動任務
2022-02-09
關於加密，解密，摘要，編碼的理解和應用
2024-06-13
加密解密
分類任務中效能度量及程式碼
2021-12-05
本地圖文直接複製到線上編輯器中
2020-11-17
地圖
AE實用指令碼之——typemonkey
2018-05-30
指令碼
基於Hyperf開發的任務排程系統.支援任務投遞,DAG任務編排(多個任務使用同一個事務).
2021-03-29
3D 列印：下游生產改變供應鏈
2018-06-10
3D
自動編碼器是什麼？教你如何使用自動編碼器增強模糊影像
2020-03-31

變分（圖）自編碼器不能直接應用於下游任務（GAE, VGAE, AE, VAE and SAE）

自編碼器（AE）

圖自編碼器（GAE）

變分自編碼器（VAE）

變分圖自編碼器（VGAE）

相關文章