Pytorch系列:（八）學習率調整方法

Neo0oeN發表於2021-07-27

原文網址 : https://www.cnblogs.com/quant-q/p/15065159.html

學習率的調整會對網路模型的訓練造成巨大的影響，本文總結了pytorch自帶的學習率調整函式，以及其使用方法。

設定網路固定學習率

設定固定學習率的方法有兩種，第一種是直接設定一些學習率，網路從頭到尾都使用這個學習率，一個例子如下：

optimizer = torch.optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

第二種方法是，可以針對不同的引數設定不同的學習率，設定方法如下：這裡給subnet2子結構設定的學習率為0.01 ，如果對某個引數不指定學習率，就使用最外層的預設學習率，這裡其他結構預設使用0.03

optimizer =optim.SGD([
    {'params': net.subnet1.parameters()}, # lr=0.03
    {'params': net.subnet2.parameters(), 'lr': 0.01}
], lr=0.03)

學習率基類

學習率調整的方法有一個基類，這個基類包含了三個屬性：

optimizer: 關聯的優化器

last_epoch: 記錄epoch數

base_lrs: 初始學習率

然後有兩個方法，其中，get_lr() 方法，可以計算下一個epoch的學習率，而step() 則表示更新下一個學習率，學習率基類如下：

class _LRScheduler(object):
  def __init__(self,optimizer,last_epoch=-1)
  
  def get_lr(self):
     raise NotImplementedError
     
  def step(self):
      pass

Pytorch自帶學習率方法

StepLR

第一個跟新策略是每隔多少步就去乘以一個係數，這裡的step_size表示執行這麼多次的step()才會更新一次

lr_scheduler.StepLR(
  optimizer,
  step_size,
  gamma=0.1,
  last_epoch=-1

)

計算方法：\(lr = lr*gamma\)

MultiStepLR

第二種方法如下，milestones是一個list，這裡會根據list裡面出現的次數進行調整， list中設定想要的epoch數量，例如 [ 100, 200, 500 ] , 模型就會在設定的epoch進行下一步學習率的計算

lr_scheduler.MultiStepLR(
optimier,
milestones,
gamma=0.1,
last_epoch=-1
)

計算方法：\(lr = lr*gamma\)

ExponentialLR

第三種方法是，通過 \(gamma^{epoch}\)這個指數函式，對學習率進行更新

lr_scheduler.ExponentialLR(
optimizer,
gamma,
last_epoch=-1
)

計算方式：\(lr = lr*gamma^{epoch}\)

CosineAnnealingLR

第四種學習率是CosineAnnealingLR，是類似於cosine函式的波動式的進行學習率更新，其中，T_max是指半個週期，就是從最高點到最低點的間隔，eta_min是最低點的值，預設設定為0

lr_scheduler.CosineAnnealingLR(
optimizer,
T_max,
eta_min=0,
last_epoch=-1
)

計算方式：\(\eta_t = \eta_{min} + \frac{1}{2}(\eta_{max} - \eta_{min})(1+cos(\frac{T_{cur}}{T_{max}}\pi))\)

其中：\(\eta_{max}\)表示學習率最大值，\(\eta_{min}\)表示學習率最小值，\(T_{cur}\)表示當前的epoch數量，\(T_{max}\)是一個固定值，通過設定這個值，可以決定cos函式的週期。

ReduceLRonPlateau

這個方法是對梯度進行監控，其中mode是模式設定，具有兩種模式，min 和max指的是如果梯度不下降，或者不上升，就進行調整；factor是調整因子；patience指的是連續多少次不變化就調整；threshold表示只有超過閾值之後，才關注學習率的變化；threshold_mode有兩種模式，rel模式：max模式下如果超過best(1+threshold)為顯著，min模式下如果低於best(1-threshold)為顯著，abs模式：max模式下如果超過best+threshold為顯著，min模式下如果低於best-threshold為顯著；cooldown是指調整後，有一段冷卻時間，多少次不對學習率進行監控；verbose表示是否列印日誌；min_lr表示學習率下限；eps 表示學習率衰減最小值；

lr_scheduler.ReduceLROnPlateau(
optimizer,
mode='min',
factor=0.1,
patience=10,
verbose=False,
threshold = 0.0001,
threshold_mode = 'rel',
cooldown=0,
min_lr = 0,
eps = 1e-08
)

LambdaLR

最後一個是可以自定義方法, 這個方法中，可以通過一個lambda來自定義學習率計算方式

lr_scheduler.LambdaLR(
optimizer,
lr_lambda,
last_epoch=-1
)

其中lr_lambda 表示自定義的函式，一個例子如下

scheduler = LambdaLR(optimizer, lr_lambda = lambda epoch: 0.1 ** ( eopch // 10 ))

學習率使用方法

下面介紹的學習率使用方法不管使用什麼樣的學習率，基本流程都差不多，只不過替換了不同的學習率方法而已，因此只看一個例子即可。注意，pytorch1.0 版本之後，官方建議將lr_scheduler 更新放到優化器更新後面。

用法
import torch
import torch.nn as nn
import torch.optim as optim

model = nn.Conv2d(3, 64, 3)
optimizer = optim.SGD(model.parameters(), lr=0.5)
lr_scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=2)

for i in range(5):
    optimizer.zero_grad()
    x = model(torch.randn(3, 3, 64, 64))
    loss = x.sum()
    loss.backward()
    print('{} optim: {}'.format(i, optimizer.param_groups[0]['lr']))
    optimizer.step() 
    print('{} scheduler: {}'.format(i, lr_scheduler.get_lr()[0]))
    lr_scheduler.step()

pytorch---在訓練中動態的調整學習率
2019-03-04
PyTorch
史上最全學習率調整策略lr_scheduler
2022-07-06
機器學習-學習率：從理論到實戰，探索學習率的調整策略
2023-12-05
機器學習
（pytorch-深度學習系列）pytorch資料操作
2020-10-12
PyTorch深度學習
Wenet分散式訓練對學習率調整的影響
2023-01-09
分散式
PYTORCH中的學習率怎麼理解
2024-10-23
PyTorch
零基礎學習人工智慧—Python—Pytorch學習（八）
2024-08-23
人工智慧PythonPyTorch
關於學習心態的調整
2020-12-05
[Docker 系列]docker 學習八，Docker 網路
2021-12-01
Docker
jackson學習之八：常用方法註解
2021-02-05
深度學習訓練過程中的學習率衰減策略及pytorch實現
2022-03-29
深度學習PyTorch
pytorch學習筆記
2020-10-24
PyTorch筆記
PyTorch 學習筆記
2024-10-11
PyTorch筆記
【Redis 系列】redis 學習八，redis 持久化 RDB 和 AOF
2022-03-31
Redis持久化
深度學習框架Pytorch學習筆記
2023-02-27
深度學習框架PyTorch筆記
創新實訓 (八) 大模型微調技術學習
2024-06-23
大模型
深度學習模型調優方法（Deep Learning學習記錄）
2020-08-05
深度學習模型
大量影片色調批次進行調整的方法
2023-02-27
彙編學習筆記07——BCD碼及調整指令
2020-10-29
筆記
《PyTorch》Part5 PyTorch之遷移學習
2020-11-21
PyTorch遷移學習
【Pytorch教程】迅速入門Pytorch深度學習框架
2024-08-26
PyTorch深度學習框架
通過示例學習PYTORCH
2022-02-11
PyTorch
ClickHouse學習系列之八【資料匯入遷移&同步】
2021-07-22
LLM 大模型學習必知必會系列(八)：10分鐘微調專屬於自己的大模型
2024-05-29
大模型
Segment-anything學習到微調系列3_SAM微調decoder
2024-07-29
批量調整視訊尺寸大小的方法，一鍵自動批量調整視訊
2021-11-30
launchpad圖示大小怎麼調整？mac圖示調整大小方法介紹
2021-02-10
Mac
第八章調整專案心態的顏色
2018-04-12
[PyTorch 學習筆記] 6.2 Normalization
2020-09-10
PyTorch筆記ORM
深度學習及pytorch基礎
2020-07-25
深度學習PyTorch
Pytorch學習筆記之tensorboard
2022-12-19
PyTorch筆記ORB
通過例項學習 PyTorch
2021-01-14
PyTorch
Pytorch學習（七）---- 儲存提取
2020-12-19
PyTorch
深度學習中的學習率排程:迴圈學習率、SGDR、1cycle 等方法介紹及實踐策略研究
2024-10-28
深度學習
遷移學習系列---基於例項方法的遷移學習
2022-03-09
遷移學習
深度學習之PyTorch實戰（4）——遷移學習
2023-03-26
深度學習PyTorch遷移學習
達夢記憶體調整及修改方法
2019-11-26
記憶體
達夢資料庫引數調整方法
2021-05-18
資料庫