Keras 提供 Callback 介面來追蹤訓練過程中的每一步結果,包括每一個 batch 和每一個 epoch。雖然名為“回撥函式”,但實際上想要擴充套件這功能需要繼承 keras.callbacks.Callback
類,該類提供兩個與模型訓練過程相關的屬性:
params
:compile 模型時設定的引數;model
:模型物件。
通過這一介面可以實時視覺化 fit
過程中每一個 batch 和每一個 epoch 迭代過程中的誤差大小變化。以《Neural Networks and Deep Learning - Chap3 Improving the way neural networks learn》為例,假設我們要訓練一個最簡單的神經網路:
這個只有一個神經元的神經網路只有一個權重 w
和一個偏置 b
兩個待訓練的引數,假設要訓練的資料只有 (1, 0)
,在這裡比較 MSE 和 Cross Entropy 兩種代價函式的學習效果。
首先構建這個模型:
from keras import Sequential, initializers, optimizers
from keras.layers import Activation, Dense
import numpy as np
def viz_keras_fit(w, b, runtime_plot=False, loss="mean_squared_error", act="sigmoid"):
d = DrawCallback(runtime_plot=runtime_plot)
# 初始化引數
w = initializers.Constant([w])
b = initializers.Constant([b])
x_train, y_train = np.array([1]), np.array([0])
model = Sequential()
model.add(Dense(1,
activation=act,
input_shape=(1,),
kernel_initializer=w,
bias_initializer=b))
# Learning Rate = 0.15
sgd = optimizers.SGD(lr=0.15)
model.compile(optimizer=sgd, loss=loss)
model.fit(x = x_train,
y = y_train,
epochs=150,
verbose=0,
callbacks=[d]) # Callback List
return d
複製程式碼
初始引數仍然是 (2, 2)
換成 Cross Entropy 作為 loss function 之後:
雖然實現了實時視覺化,但繪圖所用的時間可能比一個 epoch 耗時更久,因此先記錄每一步的 loss 再繪圖會更好一些:
實時觀察模型的學習情況可以幫助我們在初期選擇損失函式、啟用函式、模型結構以及超引數等。以下是 DrawCallback
的實現:
import pylab as pl
from IPython import display
from keras.callbacks import Callback
class DrawCallback(Callback):
def __init__(self, runtime_plot=True):
super().__init__()
self.init_loss = None
self.runtime_plot = runtime_plot
self.xdata = []
self.ydata = []
def _plot(self, epoch=None):
epochs = self.params.get("epochs")
pl.ylim(0, int(self.init_loss*2))
pl.xlim(0, epochs)
pl.plot(self.xdata, self.ydata)
pl.xlabel('Epoch {}/{}'.format(epoch or epochs, epochs))
pl.ylabel('Loss {:.4f}'.format(self.ydata[-1]))
def _runtime_plot(self, epoch):
self._plot(epoch)
display.clear_output(wait=True)
display.display(pl.gcf())
pl.gcf().clear()
def plot(self):
self._plot()
pl.show()
def on_epoch_end(self, epoch, logs = None):
logs = logs or {}
loss = logs.get("loss")
if self.init_loss is None:
self.init_loss = loss
self.xdata.append(epoch)
self.ydata.append(loss)
if self.runtime_plot:
self._runtime_plot(epoch)
複製程式碼