【Caffe篇】--Caffe solver層從初始到應用

LHBlog發表於2018-06-30

原文網址 : https://www.cnblogs.com/LHWorldBlog/p/9247070.html

一、前述

solve主要是定義求解過程，超引數的

二、具體

#往往loss function是非凸的，沒有解析解,我們需要通過優化方法來求解。
#caffe提供了六種優化演算法來求解最優引數，在solver配置檔案中，通過設定type型別來選擇。

    Stochastic Gradient Descent (type: "SGD"),
    AdaDelta (type: "AdaDelta"),
    Adaptive Gradient (type: "AdaGrad"),
    Adam (type: "Adam"),
    Nesterov’s Accelerated Gradient (type: "Nesterov") and
    RMSprop (type: "RMSProp")


net: "examples/mnist/lenet_train_test.prototxt"  #網路配置檔案位置
test_iter: 100
test_interval: 500
base_lr: 0.01#基礎學習率
momentum: 0.9
type: SGD
weight_decay: 0.0005
lr_policy: "inv"
gamma: 0.0001
power: 0.75
display: 100
max_iter: 20000
snapshot: 5000
snapshot_prefix: "examples/mnist/lenet"
solver_mode: CPU

net: "examples/mnist/lenet_train_test.prototxt" #網路位置
train_net: "examples/hdf5_classification/logreg_auto_train.prototxt" #也可以分別設定train和test
test_net: "examples/hdf5_classification/logreg_auto_test.prototxt"

test_iter: 100 #迭代了多少個測試樣本呢？ batch*test_iter 假設有5000個測試樣本，一次測試想跑遍這5000個則需要設定test_iter×batch=5000

test_interval: 500 #測試間隔。也就是每訓練500次，才進行一次測試。


base_lr: 0.01 #base_lr用於設定基礎學習率

lr_policy: "inv" #學習率調整的策略 希望學習率越來越小

        - fixed:　　 保持base_lr不變.
        - step: 　　 如果設定為step,則還需要設定一個stepsize,  返回 base_lr * gamma ^ (floor(iter / stepsize)),其中iter表示當前的迭代次數
        - exp:   　　返回base_lr * gamma ^ iter， iter為當前迭代次數
        - inv:　　    如果設定為inv,還需要設定一個power, 返回base_lr * (1 + gamma * iter) ^ (- power)
        - multistep: 如果設定為multistep,則還需要設定一個stepvalue。這個引數和step很相似，step是均勻等間隔變化，而multistep則是根據                                             stepvalue值變化
        - poly: 　　  學習率進行多項式誤差, 返回 base_lr (1 - iter/max_iter) ^ (power)
        - sigmoid:　學習率進行sigmod衰減，返回 base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))

momentum ：0.9 #動量 一般是固定為0.9

display: 100 #每訓練100次，在螢幕上顯示一次。如果設定為0，則不顯示。

max_iter: 20000 #最大迭代次數，2W次就停止了

snapshot: 5000 #快照。將訓練出來的model和solver狀態進行儲存，snapshot用於設定訓練多少次後進行儲存
snapshot_prefix: "examples/mnist/lenet" 

solver_mode: CPU #設定執行模式。預設為GPU,如果你沒有GPU,則需要改成CPU,否則會出錯。

【Caffe篇】--Caffe從入門到初始及各層介紹
2018-06-30
(8)caffe總結之solver及其配置
2020-04-04
【caffe2從頭學】：2.學習caffe2
2018-09-03
【機器學習篇】--SVD從初始到應用
2018-06-12
機器學習
caffe網路各層引數詳解
2018-10-16
MXnet轉caffe
2019-05-30
(14)caffe總結之Linux下Caffe如何除錯
2020-04-04
Linux除錯
caffe make 編譯
2018-10-29
編譯
opencv呼叫caffe模型
2019-04-04
OpenCV模型
深度學習---之caffe如何加入Leaky_relu層
2018-05-21
深度學習
(4)caffe總結之視覺層及引數
2020-04-04
視覺
(6)caffe總結之其它常用層及引數
2020-04-04
深度學習 Caffe 初始化流程理解（資料流建立）
2019-05-06
深度學習
深度學習 Caffe 初始化流程理解（資料流建立）
2021-09-09
深度學習
Caffe轉mxnet模型——mmdnn
2018-12-21
模型DNN
【自然語言處理篇】--聊天機器人從初始到應用
2018-07-08
自然語言處理機器人
【機器學習】--Adaboost從初始到應用
2018-04-08
機器學習
Caffe轉mxnet模型——mxnet工具
2018-12-21
模型
【蜂口 | AI人工智慧】caffe新增新網路層——龍鵬的一站式caffe工程實踐連載（四）
2018-09-25
AI人工智慧
Caffe作者賈揚清：AI，從大資料演進到高效能運算
2019-03-05
AI大資料
Ubuntu 16 04 編譯 Caffe SSD
2018-09-28
Ubuntu編譯
Ubuntu 16.04 下安裝配置caffe
2018-06-20
Ubuntu
LeNet簡介以及Caffe實現
2021-09-09
【機器學習】--譜聚類從初始到應用
2018-04-06
機器學習聚類
caffe整體框架的學習的部落格,這個部落格山寨了一個caffe框架
2018-08-03
框架
《深度學習：21天實戰Caffe》
2019-12-17
深度學習
基於CPU版本的Caffe推理框架
2020-11-16
框架
(11)caffe總結之命令列解析
2020-04-04
命令列
【TensorFlow篇】--DNN初始和應用
2018-03-28
DNN
【機器學習】--GBDT演算法從初始到應用
2018-04-09
機器學習演算法
Ubuntu-16-04-編譯-Caffe-SSD
2018-09-28
Ubuntu編譯
(2)caffe總結之目錄結構
2020-04-04
【機器學習】--整合演算法從初始到應用
2018-06-22
機器學習演算法
從應用層到網路層排查 Dubbo 介面超時全記錄
2021-04-20
centos下caffe用GPU編譯搭建過程以及錯誤總結
2020-10-12
CentOSGPU編譯
caffe Ununtu 16.04.4開發環境配置(CPU版)
2019-02-16
開發環境
執行caffe自帶的mnist例項教程
2018-03-31
【蜂口 | AI人工智慧】caffe框架的使用——龍鵬的一站式caffe工程實踐連載（三）
2018-09-19
AI人工智慧框架

【Caffe篇】--Caffe solver層從初始到應用

相關文章