視覺化 Keras 訓練過程

雨神姥爺發表於2018-04-08

Keras 提供 Callback 介面來追蹤訓練過程中的每一步結果,包括每一個 batch 和每一個 epoch。雖然名為“回撥函式”,但實際上想要擴充套件這功能需要繼承 keras.callbacks.Callback 類,該類提供兩個與模型訓練過程相關的屬性:

  • params:compile 模型時設定的引數;
  • model:模型物件。

通過這一介面可以實時視覺化 fit 過程中每一個 batch 和每一個 epoch 迭代過程中的誤差大小變化。以《Neural Networks and Deep Learning - Chap3 Improving the way neural networks learn》為例,假設我們要訓練一個最簡單的神經網路:

network

這個只有一個神經元的神經網路只有一個權重 w 和一個偏置 b 兩個待訓練的引數,假設要訓練的資料只有 (1, 0),在這裡比較 MSE 和 Cross Entropy 兩種代價函式的學習效果。

首先構建這個模型:

from keras import Sequential, initializers, optimizers
from keras.layers import Activation, Dense

import numpy as np

def viz_keras_fit(w, b, runtime_plot=False, loss="mean_squared_error", act="sigmoid"):
    d = DrawCallback(runtime_plot=runtime_plot)
    
    # 初始化引數
    w = initializers.Constant([w])
    b = initializers.Constant([b])

    x_train, y_train = np.array([1]), np.array([0])
    
    model = Sequential()
    model.add(Dense(1, 
        activation=act,
        input_shape=(1,),
        kernel_initializer=w,
        bias_initializer=b))

    # Learning Rate = 0.15
    sgd = optimizers.SGD(lr=0.15)
    model.compile(optimizer=sgd, loss=loss)

    model.fit(x = x_train,
        y = y_train,
        epochs=150,
        verbose=0,
        callbacks=[d]) # Callback List
    return d
複製程式碼

視覺化 Keras 訓練過程
視覺化 Keras 訓練過程

初始引數仍然是 (2, 2) 換成 Cross Entropy 作為 loss function 之後:

視覺化 Keras 訓練過程

雖然實現了實時視覺化,但繪圖所用的時間可能比一個 epoch 耗時更久,因此先記錄每一步的 loss 再繪圖會更好一些:

視覺化 Keras 訓練過程

實時觀察模型的學習情況可以幫助我們在初期選擇損失函式、啟用函式、模型結構以及超引數等。以下是 DrawCallback 的實現:

import pylab as pl
from IPython import display
from keras.callbacks import Callback

class DrawCallback(Callback):
    def __init__(self, runtime_plot=True):
        super().__init__()
        self.init_loss = None
        self.runtime_plot = runtime_plot
        
        self.xdata = []
        self.ydata = []
    def _plot(self, epoch=None):
        epochs = self.params.get("epochs")
        pl.ylim(0, int(self.init_loss*2))
        pl.xlim(0, epochs)
    
        pl.plot(self.xdata, self.ydata)
        pl.xlabel('Epoch {}/{}'.format(epoch or epochs, epochs))
        pl.ylabel('Loss {:.4f}'.format(self.ydata[-1]))
        
    def _runtime_plot(self, epoch):
        self._plot(epoch)
        
        display.clear_output(wait=True)
        display.display(pl.gcf())
        pl.gcf().clear()
        
    def plot(self):
        self._plot()
        pl.show()
    
    def on_epoch_end(self, epoch, logs = None):
        logs = logs or {}
        loss = logs.get("loss")
        if self.init_loss is None:
            self.init_loss = loss
        self.xdata.append(epoch)
        self.ydata.append(loss)
        if self.runtime_plot:
            self._runtime_plot(epoch)
複製程式碼

Notion 筆記:視覺化 Keras 訓練過程

相關文章