tensorflow學習筆記3

weixin_34337265發表於2018-11-26

原文網址 : https://blog.csdn.net/weixin_34337265/article/details/87196474

4.2學習率

learning_rate，表示每次引數更新的幅度大小。過大會導致待優化的引數在最小值附近波動，不收斂；而學習率過小，則收斂過慢。
公式為：
程式碼如下：

import tensorflow as tf

w = tf.Variable(tf.constant(5,dtype=tf.float32))

loss = tf.square(w+1)

train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    for i in range (40):
        sess.run(train_step)
        w_val = sess.run(w)
        loss_val = sess.run(loss)
        print ("after %s steps: w is %f, loss is %f."%(i,w_val,loss_val))

指數衰減學習率
用函式表述為

global_step = tf.Variable(0,trainable = False)
learning_rate = tf.train.exponential_decay(
LEARNING_RATE_BASE,#學習率初始值
global_step,#當前訓練輪數，為不可訓練參量
LEARNING_RATE_STEP,#更新學習率的頻率
LEARNING_RATE_DECAY,#學習率衰減率
staircase = True/False#為True時取整數，為階梯型衰減，反之為平滑曲線

4.3滑動平均

通過記錄一段時間內所有引數w和b各自的平均值，可以增強模型的繁華能力。
計算公式為：
影子=衰減率影子+（1-衰減率)引數
其中，衰減率為
程式碼為
ema= tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)
其中，前者為滑動平滑率，接近1左右，後者為訓練輪數。
ema_op = ema.apply(tf.trainable_variables())
其中，apply函式表示對括號內引數求滑動平均，自變數為把所有待訓練引數彙總為列表。

with tf.control_dependencies([train_step, ema_op]):
train_op = tf.no_op(name = 'train')

正則化

神經網路在訓練過程中可能會出現過擬合的情況，即在訓練集上效果良好，而預測時效果不好，說明泛化能力差。
正則化就是在損失函式之中給每個引數w加上權重，從而引入模型複雜度指標，抑制模型噪聲，減小過擬合。
公式為
loss = loss(y與y_)+REGULARIZER*loss(w）
第二項為超引數，給出引數w在總loss的比例，有不同的取法。
對於，程式碼為loss(w)=tf.contrib.layers.l1_regularizer(REGULARIZER)(w)
對於，程式碼為loss(w)=tf.contrib.layers.l2_regularizer(REGULARIZER)(w)
把正則化修正加入到演算法中用程式碼tf.add_to_collection('losses',tf.contrib.layers.l2_regularizer(regularizer)(w))
loss=cem+tf.add_n(tf.get_collection('losses'))

TensorFlow 學習筆記
2024-10-11
筆記
TensorFlow學習筆記（二）
2019-04-11
筆記
tensorflow學習筆記——DenseNet
2020-12-12
筆記SENet
TensorFlow Java API 學習筆記
2019-03-03
JavaAPI筆記
Tensorflow學習筆記No.7
2020-10-17
筆記
Tensorflow學習筆記No.8
2020-10-24
筆記
Tensorflow學習筆記No.10
2020-12-11
筆記
Tensorflow學習筆記No.11
2020-12-12
筆記
TensorFlow學習筆記(3)tf.reduce_max，求最大值
2018-11-09
筆記
tensorflow學習筆記--embedding_lookup()用法
2018-09-20
筆記
Vue學習筆記3
2018-07-15
Vue筆記
mysql學習筆記3
2024-10-17
MySql筆記
Vue 3 學習筆記
2024-06-01
Vue筆記
Tensorflow學習筆記: 變數及共享變數
2018-08-29
筆記變數
tensorflow學習筆記keras（5）------北京大學曹健
2020-10-17
筆記Keras
強化學習-學習筆記3 | 策略學習
2022-07-05
強化學習筆記
swift學習筆記《3》-技巧
2018-09-05
Swift筆記
Vue3 學習筆記
2024-03-31
Vue筆記
docker學習筆記（3）- 映象
2022-03-16
Docker筆記
tensorflow學習筆記1——mac開發環境配置
2019-02-16
筆記Mac開發環境
AI學習筆記——Tensorflow中的Optimizer(優化器)
2018-08-15
AI筆記優化
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記 3 —— 資料獲取與清洗
2018-12-04
機器學習筆記
3月25日學習筆記
2019-03-25
筆記
Spring Boot 學習筆記(3)：MyBatis
2018-09-27
Spring Boot筆記MyBatis
3月23日學習筆記
2019-03-24
筆記
Spring 學習筆記（3）Spring MVC
2021-08-22
Spring筆記MVC
G01學習筆記-3
2021-05-16
筆記
awt&swing 學習筆記(3)
2020-12-09
筆記
深度學習筆記8：利用Tensorflow搭建神經網路
2021-09-09
深度學習筆記神經網路
WinUI 3學習筆記（3）—— ComboBox & DropDownButton & SplitButton
2021-09-14
UI筆記
機器學習框架ML.NET學習筆記【6】TensorFlow圖片分類
2019-05-31
機器學習框架筆記
行業專家分享：深度學習筆記之Tensorflow入門！
2018-07-23
行業深度學習筆記
TensorFlow常量、變數和佔位符詳解（學習筆記）
2020-11-08
變數筆記
Vue 學習筆記 (二) -- 使用 VueCli 3
2018-10-11
Vue筆記
JVM學習筆記(3)---OutOfMemory詳解
2021-09-09
JVM筆記
爬蟲入門學習筆記3
2021-01-05
爬蟲筆記
numpy的學習筆記\pandas學習筆記
2018-03-18
筆記
tensorflow 學習筆記使用CNN做英文文字分類任務
2020-10-24
筆記CNN文字分類

tensorflow學習筆記3

4.2學習率

4.3滑動平均

正則化

相關文章