教你使用Keras on Google Colab（免費GPU）微調深度神經網路

数据派THU發表於2018-10-23

原文網址 : http://www.jiqizhixin.com/articles/2018-10-23-2

KerasGoGPU神經網路

本文將指導您如何使用Google上的Keras微調VGG-16網路。

簡介

在CPU上訓練深度神經網路很困難。本教程將指導您如何使用Google Colaboratory上的Keras微調VGG-16網路，這是一個免費的GPU雲平臺。如果您是Google Colab的新手，這是適合您的地方，您將瞭解到：

如何在Colab上建立您的第一個Jupyter筆記本並使用免費的GPU。
如何在Colab上上傳和使用自定義資料集。
如何在前景分割域中微調Keras預訓練模型（VGG-16）。

現在，讓我們開始！
1. 建立您的第一個Jupyter筆記本

假定您已登入自己的Google帳戶。請按以下步驟操作：

步驟a. 導航到http://drive.google.com。
步驟b. 您將在左側窗格中看到“我的驅動器”選項卡。現在，在其中建立一個資料夾，比如Colab Notebooks。
步驟c. 右鍵單擊建立的資料夾內右窗格中的其他位置，選擇More > Colaboratory。彈出另一個視窗，您可以將筆記本命名為其他視窗，例如myNotebook.ipynb。

恭喜！！！您已經在Colab上建立了您的第一個筆記本?

2. 為筆記本設定GPU加速器

在筆記本中，選擇Runtime > Change runtime type。將彈出一個視窗。然後選擇您的執行時間型別，從硬體加速器下拉選單中選擇GPU並儲存您的設定，如下圖所示：

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

3. 將您的自定義資料集上傳到Colab

您已將筆記本設定為在GPU上執行。現在，讓我們將您的資料集上傳到Colab。在本教程中，我們處理前景分割，其中前景物件是從背景中提取的，如下圖所示：

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

影象來自changedetection.net

將資料集上傳到Colab有幾種選擇，但是，我們在本教程中考慮兩個選項；首先，我們上傳到GitHub並從中克隆到Colab，其次，我們上傳到Google雲端硬碟並直接在我們的筆記本中使用它。您可以選擇任一選項 a 或選項 b 如下：

步驟a. 從GitHub克隆

讓我們將資料集克隆到建立的筆記本上。在您的筆記本中執行：

!git clone https://github.com/lim-eren/CDnet2014.git.

您會看到這樣的東西：

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

完成！讓我們列出訓練集，看它是否有效：

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

開始了！訓練集包含25個輸入幀和25個地面真實幀。如果您已完成此步驟，可略過步驟 b並跳轉到第4節。

步驟b. 從Google雲盤下載

另一種方法是將資料集上傳到Google雲端硬碟並從中進行克隆。假設您已經壓縮了上面的培訓集，比如說CDnet2014.zip，並上傳到Google Drive中與myNotebook.ipynb相同的目錄。現在，右鍵單擊CDnet2014net.zip > 獲取可共享連結。複製檔案的ID並將其儲存在某個地方（稍後我們將使用它）。

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

然後，通過執行以下程式碼驗證Colab以訪問Google雲端硬碟。點選連結獲取驗證碼並將其貼上到文字框下方，然後按Enter鍵。

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

然後，讓我們將CDnet2014net.zip檔案內容下載到我們的Jupyter筆記本中（替換 YOUR_FILE_ID 為上面步驟中獲得的id）並通過執行以下程式碼解壓縮它：

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

完成！您已將資料集從Google雲端硬碟下載到Colab。讓我們繼續第4節，使用這個資料集構建一個簡單的神經網路。

4. 微調您的神經網路

將資料集下載到Colab後，現在讓我們在前景分割域中對Keras預訓練模型進行微調。請按照以下步驟操作：

步驟a. 首先，在筆記本上新增此程式碼段，以獲得跨機器的可重現結果（請在筆記本的單元格中執行程式碼段）：

# Run it to obtain reproducible results across machines (from keras.io)
from__future__import print_function
import numpy as np
import tensorflow as tf
import random as rn
import os
os.environ['PYTHONHASHSEED'] ='0'
np.random.seed(42)
rn.seed(12345)
session_conf = tf.ConfigProto(intra_op_parallelism_threads=1, inter_op_parallelism_threads=1)
from keras import backend as K
tf.set_random_seed(1234)
sess = tf.Session(graph=tf.get_default_graph(), config=session_conf)
K.set_session(sess)

步驟b. 建立一個從Colab載入資料的函式。此函式返回具有相應基礎事實（Y）的輸入影象（X）：

# load data func
import glob
from keras.preprocessing import image as kImage
defgetData(dataset_dir):
X_list=sorted(glob.glob(os.path.join(dataset_dir, 'x','*.jpg')))
Y_list =sorted(glob.glob(os.path.join(dataset_dir, 'y' ,'*.png')))
X= []
Y= []
for i inrange(len(X_list)):
# Load input image
x = kImage.load_img(X_list[i])
x = kImage.img_to_array(x)
X.append(x)
# Load ground-truth label and encode it to label 0 and 1
x = kImage.load_img(Y_list[i], grayscale=True)
x = kImage.img_to_array(x)
x /=255.0
x = np.floor(x)
Y.append(x)
X = np.asarray(X)
Y = np.asarray(Y)
# Shuffle the training data
idx =list(range(X.shape[0]))
np.random.shuffle(idx)
X = X[idx]
Y = Y[idx]
return X, Y

步驟c. 最初是一個vanilla編碼器——解碼器模型。我們將VGG-16預訓練模型作為編碼器進行調整，其中所有完全連線的層都被移除，只有最後一個卷積層（block5_conv3）被微調，其餘層被凍結。我們使用轉置卷積層來恢復解碼器部分中的特徵解析度。

由於它是二分類問題，binary_crossentropy因此使用並且來自網路的輸出將是0和1之間的概率值。這些概率值需要被閾值化以獲得二進位制標籤0或1，其中標籤0表示背景和標籤1代表前景。

import keras
from keras.models import Model
from keras.layers import Deconv2D, Input
definitModel():
### Encoder
net_input = Input(shape=(240,320,3))
vgg16 = keras.applications.vgg16.VGG16(include_top=False, weights='imagenet', input_tensor=net_input)
for layer in vgg16.layers[:17]:
layer.trainable =False
x = vgg16.layers[-2].output # 2nd layer from the last, block5_conv3
### Decoder
x = Deconv2D(256, (3,3), strides=(2,2), activation='relu', padding='same')(x)
x = Deconv2D(128, (3,3), strides=(2,2), activation='relu', padding='same')(x)
x = Deconv2D(64, (3,3), strides=(2,2), activation='relu', padding='same')(x)
x = Deconv2D(32, (3,3), strides=(2,2), activation='relu', padding='same')(x)
x = Deconv2D(1, (1,1), activation='sigmoid', padding='same')(x)
model = Model(inputs=vgg16.input, outputs=x)
model.compile(loss=keras.losses.binary_crossentropy, optimizer=keras.optimizers.RMSprop(lr=5e-4), metrics=['accuracy'])
return model

步驟d. 我們將學習率設定為5e-4，batch_size為1，validation_split為0.2，max-epochs為100，當驗證損失連續5次迭代沒有改善時將學習率降低10倍，並在驗證損失連續10次迭代沒有改善時提前停止訓練。現在，讓我們訓練模型吧。

# load data
dataset_path = os.path.join('CDnet2014', 'train')
X, Y = getData(dataset_path)
# init the model
model = initModel()
early = keras.callbacks.EarlyStopping(monitor='val_loss', min_delta=1e-4, patience=10)
reduce= keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=5)
model.fit(X, Y, batch_size=1, epochs=100, verbose=2, validation_split=0.2, callbacks=[reduce, early], shuffle=True)
model.save('my_model.h5')

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

使用GPU進行訓練

一次迭代大約需要1秒鐘，賊快！驗證集的最大精度高於98％。還不錯，對吧？現在，讓我們暫停一下。讓我們比較使用和不使用GPU的訓練速度（如果需要，可以跳過此比較並跳轉到測試部分）。要在沒有GPU的情況下進行訓練，請將硬體加速器設定為無（參見上面的第2節）。這是培訓日誌。沒有GPU，一次迭代需要大約30秒，而使用GPU訓練只需要1秒（大約快30倍?）。

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

不使用GPU進行訓練

現在，讓我們使用ColabGPU在測試集上測試模型（您可以執行!ls */test/*以檢視具有相應基礎事實的測試幀）。

好棒！！！只需使用25個vanilla網路的例子，我們就可以在測試集+驗證集上達到98.94％的精度。請注意，由於訓練示例的隨機性，您可能會得到與我相似的結果（不完全相同但只有很小的精度差異）。

注意一個問題：我們的模型過度擬合了訓練資料，您接下來的工作是解決這個問題。提示：使用正規化技術，如Dropout，L2，BatchNormalization。

步驟e. 讓我們通過執行以下程式碼繪製分段掩碼：

import matplotlib.pyplot as plt
idx =1#image index that you want to display

img =np.empty(3, dtype=object)
img[0] = X[idx]
img[1] =Y[idx].reshape(Y[idx].shape[0],Y[idx].shape[1])
img[2] =pred[idx].reshape(pred[idx].shape[0],pred[idx].shape[1])
title = ['input','ground-truth', 'result']
for iinrange(3):
plt.subplot(1, 3, i+1)
if i==0:
plt.imshow(img[i].astype('uint8'))
else:
plt.imshow(img[i], cmap='gray')

plt.axis('off')
plt.title(title[i])
plt.show()

好了！細分結果一點都不差！大多數物件邊界被錯誤分類了，該問題主要是由於訓練期間在損失計算中考慮空標籤（物件邊界周圍的模糊畫素）引起的。我們可以通過在損失中省略這些void標籤來更好地提高效能。您訪問以下兩個連結參考如何執行此操作：

https://github.com/lim-anggun/FgSegNet
https://github.com/lim-anggun/FgSegNet_v2

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

CDnet2014資料集上的測試結果（changedetection.net）

GitHub中提供了本教程的完整原始碼：

https://github.com/lim-anggun/tutorials/blob/master/myNotebook.ipynb

總結

在本教程中，您學習瞭如何使用Google Colab GPU並快速訓練網路。您還學習瞭如何在前景分割域中微調Keras預訓練模型，您可能會發現它在您未來的研究中很有趣。

如果您喜歡這篇文章，請隨時分享或鼓掌。祝愉快！??

原文標題：

A comprehensive guide on how tofine-tune deep neural networks using Keras on Google Colab (Free GPU)

原文連結：

https://towardsdatascience.com/a-comprehensive-guide-on-how-to-fine-tune-deep-neural-networks-using-keras-on-google-colab-free-daaaa0aced8f

[譯] Google Colab 免費 GPU 使用教程
2018-12-04
GoGPU
想免費用谷歌資源訓練神經網路？Colab 詳細使用教程 —— Jinkey 原創
2019-03-04
谷歌神經網路
Python TensorFlow深度神經網路迴歸：keras.Sequential
2023-02-03
Python神經網路Keras
Keras深度神經框架
2020-04-06
Keras框架
keras構建神經網路
2020-10-05
Keras神經網路
【Python】keras神經網路識別mnist
2018-09-12
PythonKeras神經網路
[譯] 使用 Python 和 Keras 實現卷積神經網路
2018-05-07
PythonKeras卷積神經網路
[譯] Keras 速查表：使用 Python 構建神經網路
2019-05-09
KerasPython神經網路
Google Colab的使用
2024-11-28
Go
白話深度神經網路
2019-08-20
神經網路
【Python】keras卷積神經網路識別mnist
2018-09-13
PythonKeras卷積神經網路
Keras上實現卷積神經網路CNN
2020-04-06
Keras卷積神經網路CNN
【深度學習篇】--神經網路中的卷積神經網路
2018-03-28
深度學習神經網路卷積
深度剖析卷積神經網路
2018-05-23
卷積神經網路
如何優化深度神經網路？
2019-08-06
優化神經網路
[譯] 如何在 keras 中使用迴圈神經網路創作音樂
2019-03-28
Keras神經網路
Java中神經網路Triton GPU程式設計
2024-03-10
Java神經網路GPU程式設計
在 Google Colab 中使用 JuiceFS
2024-03-22
GoUI
再聊神經網路與深度學習
2019-04-08
神經網路深度學習
AI之（神經網路+深度學習）
2018-05-31
AI神經網路深度學習
【深度學習】神經網路入門
2020-04-04
深度學習神經網路
深度學習與圖神經網路
2022-09-15
深度學習神經網路
使用深度神經網路為什麼8位足夠？
2021-07-17
神經網路
Keras結合Keras後端搭建個性化神經網路模型（不用原生Tensorflow）
2020-08-20
Keras後端神經網路模型
在 Google Colab 中快速實踐深度學習
2019-06-17
Go深度學習
【人工神經網路基礎】為什麼神經網路選擇了“深度”？
2018-09-05
神經網路
深度神經網路的壓縮與加速
2020-06-29
神經網路
【深度學習】1.4深層神經網路
2020-09-27
深度學習神經網路
深度學習三：卷積神經網路
2020-10-02
深度學習卷積神經網路
30分鐘講清楚深度神經網路
2021-09-09
神經網路
深度學習教程 | 深層神經網路
2022-04-14
深度學習神經網路
基於Keras的關聯神經網路CorrNet綜合指南
2019-08-23
Keras神經網路
神經網路基礎及Keras入門
2018-11-21
神經網路Keras
【深度學習篇】--神經網路中的調優二，防止過擬合
2018-03-28
深度學習神經網路
深度學習經典卷積神經網路之AlexNet
2020-04-06
深度學習卷積神經網路
4種除錯深度神經網路的方法
2019-01-12
除錯神經網路
深度學習之RNN(迴圈神經網路)
2018-05-28
深度學習RNN神經網路
深度學習迴圈神經網路詳解
2018-05-28
深度學習神經網路

教你使用Keras on Google Colab（免費GPU）微調深度神經網路

2. 為筆記本設定GPU加速器

3. 將您的自定義資料集上傳到Colab

步驟a. 從GitHub克隆

步驟b. 從Google雲盤下載

4. 微調您的神經網路

相關文章