SciTech-BigDataAIML-Adam動量自適應的梯度快速收斂

abaelhe發表於2024-04-19

原文網址 : https://www.cnblogs.com/abaelhe/p/18146629

http://faculty.bicmr.pku.edu.cn/~wenzw/optbook/pages/stograd/Adam.html
版權宣告
此頁面為《最最佳化：建模、演算法與理論》、《最最佳化計算方法》配套程式碼。程式碼作者：文再文、劉浩洋、戶將，程式碼整理與頁面製作：楊昊桐。

Adam 演算法
考慮最佳化問題：

minx∈Rnf(x)=1N∑i=1Nfi(x).
Adam 演算法本質上是在 RMSProp 的基礎上增加了動量項，其利用梯度的一階矩記錄動量

Sk=ρ1Sk−1+(1−ρ)gk,
記錄梯度的二階矩（與 RMSProp 相同）

Mk=ρ2Mk−1+(1−ρ)gk⊙gk,
並進行修正： Sk^=Sk1−ρk1
, Mk^=Mk1−ρk2
。利用修正的一階矩作為下降方向，並且利用修正的二階矩來逐分量調整步長，其迭代格式為

xk+1=xk−αMk^{+ϵ1n−−−−−−−−√⊙Sk}.
目錄
初始化和迭代準備
迭代主迴圈
參考頁面
版權宣告
初始化和迭代準備
輸入資訊：迭代初始值 x0 ，資料集大小 N ，樣本梯度計算函式 pgfun，目標函式值與梯度計算函式 fun 以及提供演算法引數的結構體 opts 。

輸出資訊：迭代得到的解 x 和包含迭代資訊的結構體 out 。

out.fvec ：迭代過程中的目標函式值資訊
out.nrmG ：迭代過程中的梯度範數資訊
out.epoch ：迭代過程中的時期 (epoch)資訊
function [x,out] = Adam(x0,N,pgfun,fun,opts)
從輸入的結構體 opts 中讀取引數或採取預設引數。

opts.maxit ：最大迭代次數
opts.alpha ：步長
outs.thres ：保證梯度分量累計嚴格為正的小量
opts.rho1 ：一階矩累計的權重值
opts.rho2 ：二階矩累計的權重值
opts.batchsize ：隨機演算法的批次大小
opts.verbose ：不小於 1 時輸出每步迭代資訊，否則不輸出
if ~isfield(opts, 'maxit'); opts.maxit = 5000; end
if ~isfield(opts, 'alpha'); opts.alpha = 1e-3; end
if ~isfield(opts, 'thres'); opts.thres = 1e-7; end
if ~isfield(opts, 'rho1'); opts.rho1 = 0.9; end
if ~isfield(opts, 'rho2'); opts.rho2 = 0.999; end
if ~isfield(opts, 'batchsize'); opts.batchsize = 10; end
if ~isfield(opts, 'verbose'); opts.verbose = 1; end
以 x0 為迭代初始點。計算初始點處的目標函式值和梯度，記初始時刻時期 (epoch) 為 0。

x = x0;
out = struct();
[f,g] = fun(x);
out.fvec = f;
out.nrmG = norm(g,2);
out.epoch = 0;
gsum 記錄一階矩，|ssum| 記錄二階矩。\(\rho_1\), ρ2
分別為一階矩和二階矩的衰減率。 count 用於計算時期(epoch)。

gsum = zeros(size(x));
ssum = gsum;
rho1 = opts.rho1;
rho2 = opts.rho2;
count = 1;
迭代主迴圈
Adam 的迭代迴圈，以 opts.maxit 為最大迭代次數。

for k = 1:opts.maxit
等機率地從 {1,2,…,N}
中選取批次 sk
記錄在 idx 之中，批次大小為 opts.batchsize 。計算對應的樣本的梯度。

idx = randi(N,opts.batchsize,1);
g = pgfun(x,idx);

更新一階、二階矩累計，並進行修正。利用修正的一階矩和二階矩對 x
進行更新。

ssum = rho1*ssum +  (1 - rho1)*g;
gsum = rho2*gsum + (1 - rho2)*(g.*g);
ssum_mod = ssum/(1 - rho1^k);
gsum_mod = gsum/(1 - rho2^k);

x = x - opts.alpha./sqrt(gsum_mod + opts.thres).*ssum_mod;

每當參與迭代的總樣本次數超過資料集的總樣本時，記為一個時期 (epoch)。每一個時期，記錄當前的目標函式值和梯度範數，並令時期計數加一。

if k*opts.batchsize/N >= count
    [f,g] = fun(x);
    out.fvec = [out.fvec; f];
    out.nrmG = [out.nrmG; norm(g,2)];
    out.epoch = [out.epoch; k*opts.batchsize/N];
    count = count + 1;
end

end
end

數。

for k = 1:opts.maxit
等機率地從 {1,2,…,N}
中選取批次 sk
記錄在 idx 之中，批次大小為 opts.batchsize 。計算對應的樣本的梯度。

idx = randi(N,opts.batchsize,1);
g = pgfun(x,idx);

更新一階、二階矩累計，並進行修正。利用修正的一階矩和二階矩對 x
進行更新。

ssum = rho1*ssum +  (1 - rho1)*g;
gsum = rho2*gsum + (1 - rho2)*(g.*g);
ssum_mod = ssum/(1 - rho1^k);
gsum_mod = gsum/(1 - rho2^k);

x = x - opts.alpha./sqrt(gsum_mod + opts.thres).*ssum_mod;

每當參與迭代的總樣本次數超過資料集的總樣本時，記為一個時期 (epoch)。每一個時期，記錄當前的目標函式值和梯度範數，並令時期計數加一。

if k*opts.batchsize/N >= count
    [f,g] = fun(x);
    out.fvec = [out.fvec; f];
    out.nrmG = [out.nrmG; norm(g,2)];
    out.epoch = [out.epoch; k*opts.batchsize/N];
    count = count + 1;
end

end
end
參考頁面
在頁面例項：利用隨機演算法求解邏輯迴歸問題中，我們展示了該演算法的一個應用，並且與其它隨機演算法進行比較。

其它隨機演算法參見：隨機梯度下降法、 AdaGrad、 RMSProp、 AdaDelta。

此頁面的原始碼請見： Adam.m。

版權宣告
此頁面為《最最佳化：建模、演算法與理論》、《最最佳化計算方法》配套程式碼。程式碼作者：文再文、劉浩洋、戶將，程式碼整理與頁面製作：楊昊桐。

專訪中國移動首席科學家馮俊蘭：AI業務應用需要收斂再收斂
2018-12-03
AI
自動載入的iframe高度自適應
2021-09-09
IS-IS網路收斂
2020-10-25
聊聊缺陷收斂率
2024-06-21
gridview自動適應列寬
2019-12-27
View
15.2 一致收斂
2024-06-15
自適應案例
2021-12-22
§1. 一致收斂性
2024-05-08
生成樹埠狀態與收斂
2022-03-19
前端移動端自適應方案【筆記】
2018-06-04
前端筆記
Web移動端自適應縮放介面
2020-09-19
Web
移動端web自適應適配佈局解決方案
2019-02-12
Web
textarea 高度自適應
2018-11-22
圖片自適應
2018-12-03
JFrame自適應大小
2018-12-26
自適應辛普森法
2024-10-02
尤拉計劃722:慢收斂系列
2020-06-28
iframe自適應高度的外掛
2021-09-09
移動端：對高度自適應的輸入框說不~
2019-02-16
自適應小清新的自媒體平臺
2019-05-11
vue前端自適應佈局，一步到位所有自適應
2024-08-08
Vue前端
演算法測試，怎樣才能收斂？
2020-12-26
演算法
css自適應佈局
2019-04-02
CSS
web自適應尺寸方法
2019-03-18
Web
自適應介面設計
2018-04-19
Android 螢幕自適應
2024-07-26
Android
html iframe高度自適應
2021-09-09
HTML
LMS自適應濾波
2020-12-22
【電腦科學】【2018.02】自適應運動規劃
2018-11-09
移動端法門：自適應方案和高清方案
2022-04-21
基於飛槳復現ICML頂會模型SGC，可實現超快速網路收斂
2020-10-10
模型GC
vue移動端的自適應佈局的兩種解決方案
2019-03-28
Vue
巢狀UITextView的UITableViewCell高度自適應
2018-05-28
巢狀UITextView
textarea實現高度自適應的理解
2020-11-06
Thinkphp+Bootstrap的自適應部落格
2019-05-11
PHPboot
bootstrap的圖片自適應屬性
2018-04-25
boot
lib-flexible 實現移動端自適應佈局
2018-08-07
Flex
HTML5 移動端自適應方案與踩坑
2019-03-13
HTML

SciTech-BigDataAIML-Adam動量自適應的梯度快速收斂

相關文章