利用 TensorFlow 實現卷積自編碼器

coderpai發表於2018-12-12

原文網址 : https://flycode.co/archives/282772

作者：chen_h
微訊號 & QQ：862251340
微信公眾號：coderpai
我的部落格：請點選這裡

介紹和概念

自動編碼器（Auto-encoders）是神經網路的一種形式，它的輸入資料與輸出資料是相同的。他們通過將輸入資料壓縮到一個潛在表示空間裡面，然後再根據這個表示空間將資料進行重構得到最後的輸出資料。

自編碼器的一個非常受歡迎的使用場景是影象處理。其中使用到的小技巧是用卷積層來替換全連線層。這個轉變方法是將一個非常寬的，非常瘦的（比如 100*100 的畫素點，3 通道，RGB）影象轉換成一個非常窄的，非常厚的影象。這種方法非常有助於幫助我們從影象中提取出視覺特徵，從而得到更準確的潛在表示空間。最後我們的影象重構過程採用上取樣和卷積。

這個自編碼器就稱之為卷積自編碼器（Convolutional Autoencoder，CAE）

使用卷積自編碼器

卷積自編碼器可以用於影象的重構工作。例如，他們可以學習從圖片中去除噪聲，或者重構圖片缺失的部分。

為了實現上述提到的效果，我們一般不使用相同的輸入資料和輸出資料，取而代之的是，使用含有噪聲的圖片作為輸入資料，然後輸出資料是一個乾淨的圖片。卷積自編碼器就會通過學習，去去除圖片中的噪聲，或者去填補圖片中的空缺部分。

接下來，讓我們來看一下 CAE 是如何來填充圖中眼睛上的十字架。我們假設圖片的眼睛上面存在一個十字架黑影，我們需要刪除這個十字架噪聲。首先，我們需要來手動建立這個資料庫，當然，這個動作非常方便。

現在我們的卷積自編碼器就可以開始訓練了，我們可以用它去除我們從未見過的眼睛照片上面的十字線！

利用 TensorFlow 來實現這個卷積自編碼器

看我們利用 MNIST 資料集來看看這個網路是如何實現的，完整的程式碼可以在 Github 上面下載。

網路架構

卷積自編碼器的編碼部分將是一個典型的卷積過程。每一個卷積層之後都會加上一個池化層，主要是為了減少資料的維度。解碼器需要從一個非常窄的資料空間中重構出一個寬的影象。

一般情況下，你會看到我們後面是採用反摺積層來增加我們影象的寬度和高度。它們的工作原理和卷積層的工作原理幾乎完全一樣，但是作用方向相反。比如，你有一個 3

3 的卷積核，那麼在編碼器中我們是將該區域的影象編碼成一個元素點，但是在解碼器中，也就是反摺積中，我們是把一個元素點解碼成 3

3 個元素點。TensorFlow API 為我們提供了這個功能，參考 tf.nn.conv2d_transpose

自動編碼器只需要在噪聲的影象上進行訓練，就可以非常成功的進行圖片去燥。比如，我們可以在訓練圖片中新增入高斯噪聲來建立包含噪聲的影象，然後將這些畫素值裁剪在 0 到 1 之間。我們將噪聲影象作為輸入資料，最原始的感覺影象作為輸出資料，也就是我們的目標值。

模型定義

learning_rate = 0.001
inputs_ = tf.placeholder(tf.float32, (None, 28, 28, 1), name='inputs')
targets_ = tf.placeholder(tf.float32, (None, 28, 28, 1), name='targets')
### Encoder
conv1 = tf.layers.conv2d(inputs=inputs_, filters=32, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 28x28x32
maxpool1 = tf.layers.max_pooling2d(conv1, pool_size=(2,2), strides=(2,2), padding='same')
# Now 14x14x32
conv2 = tf.layers.conv2d(inputs=maxpool1, filters=32, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 14x14x32
maxpool2 = tf.layers.max_pooling2d(conv2, pool_size=(2,2), strides=(2,2), padding='same')
# Now 7x7x32
conv3 = tf.layers.conv2d(inputs=maxpool2, filters=16, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 7x7x16
encoded = tf.layers.max_pooling2d(conv3, pool_size=(2,2), strides=(2,2), padding='same')
# Now 4x4x16
### Decoder
upsample1 = tf.image.resize_images(encoded, size=(7,7), method=tf.image.ResizeMethod.NEAREST_NEIGHBOR)
# Now 7x7x16
conv4 = tf.layers.conv2d(inputs=upsample1, filters=16, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 7x7x16
upsample2 = tf.image.resize_images(conv4, size=(14,14), method=tf.image.ResizeMethod.NEAREST_NEIGHBOR)
# Now 14x14x16
conv5 = tf.layers.conv2d(inputs=upsample2, filters=32, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 14x14x32
upsample3 = tf.image.resize_images(conv5, size=(28,28), method=tf.image.ResizeMethod.NEAREST_NEIGHBOR)
# Now 28x28x32
conv6 = tf.layers.conv2d(inputs=upsample3, filters=32, kernel_size=(3,3), padding='same', activation=tf.nn.relu)
# Now 28x28x32
logits = tf.layers.conv2d(inputs=conv6, filters=1, kernel_size=(3,3), padding='same', activation=None)
#Now 28x28x1
# Pass logits through sigmoid to get reconstructed image
decoded = tf.nn.sigmoid(logits)
# Pass logits through sigmoid and calculate the cross-entropy loss
loss = tf.nn.sigmoid_cross_entropy_with_logits(labels=targets_, logits=logits)
# Get cost and define the optimizer
cost = tf.reduce_mean(loss)
opt = tf.train.AdamOptimizer(learning_rate).minimize(cost)複製程式碼

訓練過程：

sess = tf.Session()
epochs = 100
batch_size = 200
# Set's how much noise we're adding to the MNIST images
noise_factor = 0.5
sess.run(tf.global_variables_initializer())
for e in range(epochs):
    for ii in range(mnist.train.num_examples//batch_size):
        batch = mnist.train.next_batch(batch_size)
        # Get images from the batch
        imgs = batch[0].reshape((-1, 28, 28, 1))
        
        # Add random noise to the input images
        noisy_imgs = imgs + noise_factor * np.random.randn(*imgs.shape)
        # Clip the images to be between 0 and 1
        noisy_imgs = np.clip(noisy_imgs, 0., 1.)
        
        # Noisy images as inputs, original images as targets
        batch_cost, _ = sess.run([cost, opt], feed_dict={inputs_: noisy_imgs,
                                                         targets_: imgs})
print("Epoch: {}/{}...".format(e+1, epochs),
              "Training loss: {:.4f}".format(batch_cost))複製程式碼

CoderPai 是一個專注於演算法實戰的平臺，從基礎的演算法到人工智慧演算法都有設計。如果你對演算法實戰感興趣，請快快關注我們吧。加入AI實戰微信群，AI實戰QQ群，ACM演算法微信群，ACM演算法QQ群。詳情請關注 “CoderPai” 微訊號（coderpai）。

卷積自編碼
2019-02-16
卷積
TensorFlow上實現AutoEncoder自編碼器
2020-04-06
TensorFlow上實現卷積神經網路CNN
2020-04-06
卷積神經網路CNN
【Tensorflow_DL_Note6】Tensorflow實現卷積神經網路(1)
2018-04-18
卷積神經網路
【Tensorflow_DL_Note7】Tensorflow實現卷積神經網路(2)
2018-04-18
卷積神經網路
用於影像降噪的卷積自編碼器 | 視覺進階
2019-12-20
卷積視覺
圖卷積神經網路(GCN)理解與tensorflow2.0程式碼實現
2020-11-19
卷積神經網路GC
迴圈碼、卷積碼及其python實現
2022-06-19
卷積Python
Tensorflow快餐教程(9)-卷積
2018-05-04
卷積
用深度卷積自編碼器在10分鐘內降低影像噪聲
2020-10-06
卷積
seq2seq通俗理解----編碼器和解碼器(TensorFlow實現)
2019-08-30
TensorFlow 一步一步實現卷積神經網路
2018-04-01
卷積神經網路
Keras上實現AutoEncoder自編碼器
2020-04-06
Keras
TensorFlow實戰卷積神經網路之LeNet
2018-04-03
卷積神經網路
利用Python實現卷積神經網路的視覺化
2019-03-04
Python卷積神經網路視覺化
基於卷積神經網路和tensorflow實現的人臉識別
2018-04-01
卷積神經網路
預測電影偏好？如何利用自編碼器實現協同過濾方法
2018-05-20
Tensorflow-卷積神經網路CNN
2021-01-31
卷積神經網路CNN
FPGA數字訊號處理（27）卷積編碼器與Viterbi譯碼器設計
2018-09-18
FPGA卷積Viterbi
樹莓派上利用Tensorflow實現小車的自動駕駛
2019-01-17
樹莓派自動駕駛
40行Python程式碼，實現卷積特徵視覺化
2019-03-17
Python卷積特徵視覺化
verilog實現矩陣卷積運算
2019-05-24
矩陣卷積
FSNet：利用卷積核概要進行深度卷積神經網路的壓縮
2020-03-28
卷積神經網路
使用全卷積神經網路FCN，進行影像語義分割詳解(附帶Tensorflow詳解程式碼實現)
2020-07-24
卷積神經網路
TensorFlow 卷積神經網路之貓狗識別
2021-09-09
卷積神經網路
利用tensorflow.js實現JS中的AI
2019-01-07
JSAI
利用 Redis 生成序列號的功能實現編號自增
2024-04-24
Redis
Git 伺服器利用 hook 實現自動部署
2018-12-10
Git伺服器Hook
利用Python實現自動掃雷小指令碼
2019-01-10
Python指令碼
利用 webhook 實現 Git 自動部署 Laravel 程式碼
2018-08-16
WebHookGitLaravel
自動編碼器
2020-04-06
Keras上實現卷積神經網路CNN
2020-04-06
Keras卷積神經網路CNN
【python實現卷積神經網路】卷積層Conv2D反向傳播過程
2020-04-16
Python卷積神經網路反向傳播
CS131 homework1 使用numpy實現卷積
2020-11-21
卷積
卷積神經網路的原理及Python實現
2024-05-25
卷積神經網路Python
《卷積神經網路的Python實現》筆記
2020-12-29
卷積神經網路Python筆記
使用tensorflow和cnn（卷積神經網路）識別驗證碼並構建API
2019-03-24
CNN卷積神經網路API
自動佈署伺服器環境，並利用 Git 實現原生程式碼自動同步到伺服器！
2018-04-01
伺服器Git