第9章使用Scikit-Learn呼叫Keras的模型

優惠券活動發表於2018-06-01

原文網址 : https://flycode.co/archives/188973

Keras模型

第9章使用Scikit-Learn呼叫Keras的模型

scikit-learn是最受歡迎的Python機器學習庫。本章我們將使用scikit-learn呼叫Keras生成的模型。本章將：

使用scikit-learn封裝Keras的模型
使用scikit-learn對Keras的模型進行交叉驗證
使用scikit-learn，利用網格搜尋調整Keras模型的超參

我們開始吧。

9.1 簡介

Keras在深度學習很受歡迎，但是隻能做深度學習：Keras是最小化的深度學習庫，目標在於快速搭建深度學習模型。基於SciPy的scikit-learn，數值運算效率很高，適用於普遍的機器學習任務，提供很多機器學習工具，包括但不限於：

使用K折驗證模型
快速搜尋並測試超參

Keras為scikit-learn封裝了KerasClassifier和KerasRegressor。本章我們繼續使用第7章的模型。

9.2 使用交叉驗證檢驗深度學習模型

Keras的KerasClassifier和KerasRegressor兩個類接受build_fn引數，傳入編譯好的模型。我們加入nb_epoch=150和batch_size=10這兩個引數：這兩個引數會傳入模型的fit()方法。我們用scikit-learn的StratifiedKFold類進行10折交叉驗證，測試模型在未知資料的效能，並使用cross_val_score()函式檢測模型，列印結果。

# MLP for Pima Indians Dataset with 10-fold cross validation via sklearn
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.cross_validation import StratifiedKFold
from sklearn.cross_validation import cross_val_score
import numpy
import pandas
# Function to create model, required for KerasClassifier
def create_model():
    # create model
    model = Sequential()
    model.add(Dense(12, input_dim=8, init=`uniform`, activation=`relu`)) model.add(Dense(8, init=`uniform`, activation=`relu`)) model.add(Dense(1, init=`uniform`, activation=`sigmoid`))
    # Compile model
    model.compile(loss=`binary_crossentropy`, optimizer=`adam`, metrics=[`accuracy`]) return model
# fix random seed for reproducibility
seed = 7
numpy.random.seed(seed)
# load pima indians dataset
dataset = numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X = dataset[:,0:8]
Y = dataset[:,8]
# create model
model = KerasClassifier(build_fn=create_model, nb_epoch=150, batch_size=10)
# evaluate using 10-fold cross validation
kfold = StratifiedKFold(y=Y, n_folds=10, shuffle=True, random_state=seed)
results = cross_val_score(model, X, Y, cv=kfold)
print(results.mean())

每輪訓練會輸出一次結果，加上最終的平均效能：

...
Epoch 145/150
692/692 [==============================] - 0s - loss: 0.4671 - acc: 0.7803
Epoch 146/150
692/692 [==============================] - 0s - loss: 0.4661 - acc: 0.7847
Epoch 147/150
692/692 [==============================] - 0s - loss: 0.4581 - acc: 0.7803
Epoch 148/150
692/692 [==============================] - 0s - loss: 0.4657 - acc: 0.7688
Epoch 149/150
692/692 [==============================] - 0s - loss: 0.4660 - acc: 0.7659
Epoch 150/150
692/692 [==============================] - 0s - loss: 0.4574 - acc: 0.7702
76/76 [==============================] - 0s
0.756442244065

比起手工測試，使用scikit-learn容易的多。

9.3 使用網格搜尋調整深度學習模型的引數

使用scikit-learn封裝Keras的模型十分簡單。進一步想：我們可以給fit()方法傳入引數，KerasClassifier的build_fn方法也可以傳入引數。可以利用這點進一步調整模型。

我們用網格搜尋測試不同引數的效能：create_model()函式可以傳入optimizer和init引數，雖然都有預設值。那麼我們可以用不同的優化演算法和初始權重調整網路。具體說，我們希望搜尋：

優化演算法：搜尋權重的方法
初始權重：初始化不同的網路
訓練次數：對模型訓練的次數
批次大小：每次訓練的資料量

所有的引數組成一個字典，傳入scikit-learn的GridSearchCV類：GridSearchCV會對每組引數（2×3×3×3）進行訓練，進行3折交叉檢驗。

計算量巨大：耗時巨長。如果模型小還可以取一部分資料試試。第7章的模型可以用，因為網路和資料集都不大（1000個資料內，9個引數）。最後scikit-learn會輸出最好的引數和模型，以及平均值。

# MLP for Pima Indians Dataset with grid search via sklearn
from keras.models import Sequential
from keras.layers import Dense
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.grid_search import GridSearchCV
import numpy
import pandas
# Function to create model, required for KerasClassifier
def create_model(optimizer=`rmsprop`, init=`glorot_uniform`):
    # create model
    model = Sequential()
    model.add(Dense(12, input_dim=8, init=init, activation=`relu`)) model.add(Dense(8, init=init, activation=`relu`)) model.add(Dense(1, init=init, activation=`sigmoid`))
    # Compile model
    model.compile(loss=`binary_crossentropy`, optimizer=optimizer, metrics=[`accuracy`]) return model
# fix random seed for reproducibility
seed = 7
numpy.random.seed(seed)
# load pima indians dataset
dataset = numpy.loadtxt("pima-indians-diabetes.csv", delimiter=",")
# split into input (X) and output (Y) variables
X = dataset[:,0:8]
Y = dataset[:,8]
# create model
model = KerasClassifier(build_fn=create_model)
# grid search epochs, batch size and optimizer
optimizers = [`rmsprop`, `adam`]
init = [`glorot_uniform`, `normal`, `uniform`]
epochs = numpy.array([50, 100, 150])
batches = numpy.array([5, 10, 20])
param_grid = dict(optimizer=optimizers, nb_epoch=epochs, batch_size=batches, init=init) grid = GridSearchCV(estimator=model, param_grid=param_grid)
grid_result = grid.fit(X, Y)
# summarize results
print("Best: %f using %s" % (grid_result.best_score_, grid_result.best_params_))
for params, mean_score, scores in grid_result.grid_scores_:
    print("%f (%f) with: %r" % (scores.mean(), scores.std(), params))

用CPU差不多要5分鐘，結果如下。我們發現使用均勻分佈初始化，rmsprop優化演算法，150輪，批尺寸為5時效果最好，正確率約75%：

Best: 0.751302 using {`init`: `uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 150, `batch_size`: 5}
0.653646 (0.031948) with: {`init`: `glorot_uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 50, `batch_size`: 5}
0.665365 (0.004872) with: {`init`: `glorot_uniform`, `optimizer`: `adam`, `nb_epoch`: 50, `batch_size`: 5}
0.683594 (0.037603) with: {`init`: `glorot_uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 100, `batch_size`: 5}
0.709635 (0.034987) with: {`init`: `glorot_uniform`, `optimizer`: `adam`, `nb_epoch`: 100, `batch_size`: 5}
0.699219 (0.009568) with: {`init`: `glorot_uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 150, `batch_size`: 5}
0.725260 (0.008027) with: {`init`: `glorot_uniform`, `optimizer`: `adam`, `nb_epoch`: 150, `batch_size`: 5}
0.686198 (0.024774) with: {`init`: `normal`, `optimizer`: `rmsprop`, `nb_epoch`: 50, `batch_size`: 5}
0.718750 (0.014616) with: {`init`: `normal`, `optimizer`: `adam`, `nb_epoch`: 50, `batch_size`: 5}
0.725260 (0.028940) with: {`init`: `normal`, `optimizer`: `rmsprop`, `nb_epoch`: 100, `batch_size`: 5}
0.727865 (0.028764) with: {`init`: `normal`, `optimizer`: `adam`, `nb_epoch`: 100, `batch_size`: 5}
0.748698 (0.035849) with: {`init`: `normal`, `optimizer`: `rmsprop`, `nb_epoch`: 150, `batch_size`: 5}
0.712240 (0.039623) with: {`init`: `normal`, `optimizer`: `adam`, `nb_epoch`: 150, `batch_size`: 5}
0.699219 (0.024910) with: {`init`: `uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 50, `batch_size`: 5}
0.703125 (0.011500) with: {`init`: `uniform`, `optimizer`: `adam`, `nb_epoch`: 50, `batch_size`: 5}
0.720052 (0.015073) with: {`init`: `uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 100, `batch_size`: 5}
0.712240 (0.034987) with: {`init`: `uniform`, `optimizer`: `adam`, `nb_epoch`: 100, `batch_size`: 5}
0.751302 (0.031466) with: {`init`: `uniform`, `optimizer`: `rmsprop`, `nb_epoch`: 150, `batch_size`: 5}
0.734375 (0.038273) with: {`init`: `uniform`, `optimizer`: `adam`, `nb_epoch`: 150, `batch_size`: 5}
...

9.4 總結

本章關於使用scikit-learn封裝並測試神經網路的效能。總結一下：

如何使用scikit-learn封裝Keras模型
如何使用scikit-learn測試Keras模型的效能
如何使用scikit-learn調整Keras模型的超參

使用scikit-learn調整引數比手工呼叫Keras簡便的多。

keras中VGG19預訓練模型的使用
2018-07-24
Keras模型
TensorFlow2.0教程-使用keras訓練模型
2020-02-17
Keras模型
Keras 轉換成 Tensorflow 模型格式並使用
2019-07-10
Keras模型
scikit-learn: 使用conda安裝scikit-learn
2018-11-28
教程帖：使用TensorFlow服務和Flask部署Keras模型！
2018-10-26
FlaskKeras模型
如何將keras訓練的模型轉換成tensorflow lite模型
2018-08-21
Keras模型
【tf.keras】tf.keras載入AlexNet預訓練模型
2019-05-29
Keras模型
如何將keras訓練好的模型轉換成tensorflow的.pb的檔案並在TensorFlow serving環境呼叫
2018-07-26
Keras模型
【tf.keras】tf.keras使用tensorflow中定義的optimizer
2019-06-06
Keras
Keras上實現Softmax迴歸模型
2020-04-06
Keras模型
運用預訓練 Keras 模型來處理影像分類請求，學習如何使用從 Keras 建立 SavedModel
2024-04-09
Keras模型
【Keras篇】---Keras初始，兩種模型構造方法，利用keras實現手寫數字體識別
2018-03-30
Keras模型構造方法
如何呼叫openai的TTS模型
2024-09-04
OpenAITTS模型
實驗12-使用keras預訓練模型完成貓狗識別
2024-04-27
Keras模型
tf.keras: 儲存與載入模型
2020-12-14
Keras模型
opencv呼叫caffe模型
2019-04-04
OpenCV模型
Java 呼叫 PaddleDetection 模型
2023-02-20
Java模型
[需求建議]跨模型呼叫？分類能呼叫單獨模型？
2019-05-11
模型
Keras結合Keras後端搭建個性化神經網路模型（不用原生Tensorflow）
2020-08-20
Keras後端神經網路模型
使用關聯模型的鏈式呼叫時-有無括號的區別
2020-05-24
模型
【Keras篇】---利用keras改寫VGG16經典模型在手寫數字識別體中的應用
2018-03-30
Keras模型
關於keras框架的介紹以及操作使用
2021-10-21
Keras框架
使用LLaMA-Factory訓練LLM大模型並用ollama呼叫
2024-10-16
大模型
基於Theano的深度學習框架keras及配合SVM訓練模型
2020-04-06
深度學習框架Keras模型
基於Keras和Gunicorn+Flask部署深度學習模型
2019-10-08
KerasFlask深度學習模型
【Python】keras使用LSTM擬合曲線
2018-09-21
PythonKeras
使用 C++ 呼叫 YOLOv3 模型進行物體檢測
2024-12-05
C++YOLO模型
C#使用OllamaSharp呼叫Llama 3、Phi 3等大語言模型
2024-07-21
C#模型
keras轉tensorflow lite【方法二】直接轉：簡單模型例項
2019-01-08
Keras模型
使用scikit-learn機器學習庫裡面的xgboost
2020-12-05
機器學習
【Python】keras使用Lenet5識別mnist
2018-09-14
PythonKeras
【Python 3】keras.layers.Lambda解析與使用
2021-01-02
PythonKeras
TensorFlow 呼叫預訓練好的模型—— Python 實現
2018-10-10
模型Python
用免費TPU訓練Keras模型，速度還能提高20倍！
2019-04-05
Keras模型
Scikit-learn學習
2020-04-06
scikit-learn介紹
2020-04-06
在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 間接呼叫 Python 實現
2019-03-03
C++模型Python
ML.NET呼叫Tensorflow模型示例——MNIST
2019-05-21
模型

第9章使用Scikit-Learn呼叫Keras的模型