李沐：用隨機梯度下降來最佳化人生！

算法金「全网同名」發表於2024-06-17

原文網址 : https://www.cnblogs.com/suanfajin/p/18251862

隨機梯度

大俠幸會，在下全網同名「演算法金」

0 基礎轉 AI 上岸，多個演算法賽 Top

「日更萬日，讓更多人享受智慧樂趣」

今天我們來聊聊達叔 6 大核心演算法之 —— 最佳化演算法。吳恩達：機器學習的六個核心演算法！

梯度下降最佳化演算法是機器學習和深度學習中最常用的最佳化演算法之一。它透過不斷調整模型引數，使得損失函式的值逐漸減小，從而使模型逐步逼近最優解

梯度下降最佳化演算法的優點

簡單易實現：梯度下降演算法的基本原理簡單，容易理解和實現
廣泛應用：無論是線性迴歸、邏輯迴歸，還是複雜的神經網路，梯度下降演算法都可以應用

梯度下降最佳化演算法的缺點

依賴初始值：梯度下降演算法的收斂速度和最終結果可能會受到初始值的影響
容易陷入區域性最優：在複雜的非凸損失函式中，梯度下降演算法可能會陷入區域性最優解，而無法找到全域性最優解

梯度下降演算法的改進

為了克服上述缺點，研究人員提出了多種改進演算法，如動量法、Adagrad、Adam等。這些改進演算法在加速收斂、避免區域性最優等方面有顯著效果。我們將在後續內容中詳細介紹這些改進演算法

2. 應用和普遍性

梯度下降法在最佳化神經網路中的應用和普遍性

梯度下降法在機器學習和深度學習中的重要性不可忽視。作為一種經典的最佳化演算法，梯度下降法被廣泛應用於各種模型的訓練過程中，尤其是在神經網路的最佳化中。

梯度下降法的基本原理

梯度下降法的核心思想是透過不斷調整模型引數，使得損失函式的值逐漸減小，從而使模型逐步逼近最優解。具體來說，梯度下降法透過計算損失函式相對於模型引數的梯度，然後沿著梯度的反方向更新引數，以達到最小化損失函式的目的。

神經網路中的應用

在神經網路的訓練過程中，梯度下降法起到了至關重要的作用。神經網路的訓練過程本質上就是一個透過梯度下降法最佳化損失函式的過程。具體步驟如下：

前向傳播：計算當前引數下的模型輸出和損失函式值
反向傳播：計算損失函式相對於模型引數的梯度
引數更新：使用梯度下降法更新模型引數

這個過程會反覆進行，直到損失函式的值收斂到某個最小值。

普遍性

梯度下降法不僅在神經網路中廣泛應用，還被應用於其他很多機器學習模型中，比如線性迴歸、邏輯迴歸、支援向量機等。它的普遍性和適用性使得它成為機器學習領域的一個重要工具。

在實際應用中，梯度下降法的具體形式有很多，比如批梯度下降法、隨機梯度下降法和小批次梯度下降法。不同形式的梯度下降法在計算效率、收斂速度和收斂穩定性上各有優劣，我們將在下一部分詳細介紹這些變形形式。

3. 梯度下降法的變形形式

批梯度下降法：使用整個資料集計算梯度
隨機梯度下降法（SGD）：使用單個樣本計算梯度
小批次梯度下降法：使用小批次樣本計算梯度

隨機梯度下降法（SGD）

隨機梯度下降法是一種透過每次僅使用一個樣本來計算梯度的變形形式。它每次隨機選擇一個樣本進行引數更新，這使得演算法在處理大型資料集時更加高效。

優點

計算效率高：每次更新只需要計算一個樣本的梯度，大大減少了計算開銷
記憶體需求低：每次只需載入一個樣本，節省記憶體

缺點

收斂不穩定：由於每次更新基於單個樣本，梯度估計有較大噪聲，可能導致收斂過程不穩定
可能震盪：在非凸損失函式中，更新方向可能來回震盪，難以到達全域性最優解

公式

隨機梯度下降法的更新公式如下：

用隨機梯度下降來最佳化人生

參照李沐曾寫過的一篇短文：用隨機梯度下降來最佳化人生

李沐 | CMU，前亞馬遜首席科學家

生活中很多事，聽起來複雜，其實用簡單的演算法就能解決，比如隨機梯度下降。這演算法不僅能最佳化機器學習模型，也能用來最佳化我們的人生。

確立目標

首先，人生要有目標。短期的目標也好，長期的目標也罷，總得有個方向。就像隨機梯度下降有個目標函式一樣，有了目標，才有了努力的意義。目標不需要一開始就完美，重要的是，有了這個目標，你就有了努力的動力。

設立宏大目標

目標不宜太簡單。若目標輕易就能達到，那未免太過無聊。大目標，哪怕一時達不到，至少給你一個奮鬥的方向。初期可以定些小目標，比如期末考個 80 分，但更長遠的目標要宏大些，比如財富自由、創業成功。這些目標雖然看似遙遠，但正是因為有了這些大目標，你才會不斷進步。

持續努力

隨機梯度下降的核心是簡單而持續的努力。每一步，找到一個大致正確的方向，然後邁出一步。生活也是如此，每一步的努力，都是朝著目標邁進。關鍵在於，持續不斷地邁步。哪怕步子小，只要一直走，總會離目標越來越近。

迎接變化

改變是痛苦的，但沒有改變，就沒有進步。生活中的每一步，都是在調整自己的方向和步伐。你可能會感到痛苦，但這是前進的必要過程。反之，過於舒適，可能意味著停滯不前。要時刻挑戰自己，不斷突破舒適區。

合理休息

生活中的步伐不宜太快，也不宜太慢。步伐太小，進展緩慢；步伐太大，容易疲憊。就像隨機梯度下降中需要調整步長一樣，生活中也需要合理的休息和調整。適時休息，可以讓你更持久地前行。

廣泛探索

前進的方向取決於你對世界的認識。如果你只在一個地方打轉，那麼目標可能過於簡單，或者你陷入了舒適區。隨機梯度下降中的“隨機”提醒我們，要不斷探索新的領域，接受挑戰，嘗試新的事物，這樣才能找到更好的路徑。

不急不躁

不必急於找到完美的方向和步伐。雖然有人進展迅速，但隨機梯度下降告訴我們，前期的徘徊和探索是必要的。如果一開始就找到最優解，反而後期可能乏力。所以，不要急於求成，前期的探索是為了更好的前進。

重要的起點

起點確實重要。如果你起點較高，自然會少走很多彎路。但即便起點不高，只要持續努力，也能達到目標。不要過分在意起點，重要的是過程中的努力和調整。

堅持到底

即使起點較低，前方的道路也許更加坎坷，但只要堅持不懈，按照正確的方向前進，最終都會達到目標。遇到困難時，調整步伐，重新出發，總能找到前進的方向。

獨特之路

每個人的目標和路徑都是獨特的。雖然大家可能有相似的目標，但每個人的經歷和路徑各不相同。要找到適合自己的道路，雖然每次的引數不同，但最終的目標相似。

簡單為上

雖然有比隨機梯度下降更復雜的演算法，但面對複雜的人生目標，簡單的方法往往更有效。關注當下，每次邁出小步，快速做出決定，持續前行。只要有目標，不停步，就能達到目的。

總結

生活就像隨機梯度下降，不斷調整方向，邁出步伐，最終達到目標。不要怕犯錯，不要怕徘徊，只要堅持，總能找到前進的路。

[ 抱個拳，總個結 ]

吳恩達：機器學習的六個核心演算法！

迴歸演算法，邏輯迴歸，決策樹演算法，神經網路，K-means，梯度下降（本文）

- 科研為國分憂，創新與民造福 -

日更時間緊任務急，難免有疏漏之處，還請大俠海涵

內容僅供學習交流之用，部分素材來自網路，侵聯刪

機器學習之隨機梯度下降法
2020-06-13
機器學習隨機梯度
隨機梯度下降法的數學基礎
2023-01-18
隨機梯度
大白話5分鐘帶你走進人工智慧-第十一節梯度下降之手動實現梯度下降和隨機梯度下降的程式碼（6）
2019-04-15
人工智慧梯度隨機
【機器學習】梯度下降
2020-08-11
機器學習梯度
李巨集毅機器學習課程筆記-3.梯度下降精講
2020-12-27
機器學習筆記梯度
梯度下降
2018-11-21
梯度
機器學習之梯度下降
2020-02-08
機器學習梯度
【機器學習】梯度下降 II
2020-09-20
機器學習梯度
003.01 梯度下降
2019-09-17
梯度
機器學習之梯度下降法
2020-06-12
機器學習梯度
【機器學習基礎】——梯度下降
2021-10-12
機器學習梯度
李沐重返母校上海交大，從LLM聊到個人生涯，這裡是演講全文
2024-08-26
機器學習方法（一）——梯度下降法
2018-10-12
機器學習梯度
機器學習——梯度下降演算法
2019-07-24
機器學習梯度演算法
梯度下降與excel
2019-01-04
梯度Excel
實現梯度下降
2018-07-21
梯度
機器學習演算法（2）用Python實現自適應線性神經元（隨機梯度下降+線上學習）
2020-11-23
機器學習演算法Python隨機梯度
梯度下降演算法
2018-07-05
梯度演算法
1. 梯度下降法
2022-06-18
梯度
機器學習中梯度下降演算法的實際應用和技巧
2019-03-22
機器學習梯度演算法
什麼是梯度下降法？
2018-07-11
梯度
機器學習入門筆記——如何理解梯度下降
2018-03-11
機器學習筆記梯度
機器學習筆記(1): 梯度下降演算法
2024-06-02
機器學習筆記梯度演算法
李沐大佬-動手學深度學習筆記-注意力機制
2024-11-19
深度學習筆記
梯度下降求解最小二乘
2018-06-22
梯度
有監督學習——梯度下降
2023-03-11
梯度
梯度下降演算法 Gradient Descent
2023-01-14
梯度演算法
梯度下降法原理及小結
2020-12-23
梯度
機器學習--線性迴歸--梯度下降的實現
2020-10-08
機器學習梯度
機器學習梯度下降法，最通俗易懂的解釋
2019-03-28
機器學習梯度
梯度下降優化演算法概述
2018-08-31
梯度優化演算法
梯度下降法中導數的求解
2021-09-09
梯度
MySQL 用隨機資料填充外來鍵表
2018-06-21
MySql隨機
李沐動手學深度學習V2-chap_preliminaries
2024-07-02
深度學習
梯度下降、過擬合和歸一化
2018-09-08
梯度
深入淺出--梯度下降法及其實現
2021-09-09
梯度
李沐、劉群、劉洋、朱靖波、張民：當前機器翻譯的瓶頸
2020-11-12
【Andrew Ng 機器學習】Week 1（二）：代價函式和梯度下降
2019-03-02
機器學習函式梯度