高博14講中P110頁一二階梯度法的相關理解

robinhjwy發表於2017-09-09

高博14將在110頁的6.2.1中寫到:
前面定義好的目標函式:
這裡寫圖片描述

求解增量最直觀的方式是將目標函式在x附近進行泰勒展開:
這裡寫圖片描述

這裡J是目標函式關於x的導數(雅克比矩陣),而H則是二階導數(海塞[hessian]矩陣)。我們可以選擇保留泰勒展開的一階二階項,對應的求解方法則為一階梯度或二階梯度法。如果保留一階梯度,那麼增量的解就為:
這裡寫圖片描述
它的直觀意義非常簡單,只要我們沿著反向梯度方向前進即可。通常我們還會計算該方向上的一個步長,求得最快的下降方式。這種方法被稱為最速下降法。

這裡有幾個問號臉(數學比較渣導致的):
1、J(x)是如何定義的?
2、增量的解怎麼求出來的?
3、增量的解為什麼有個轉置T?
4、梯度是什麼?

1、基本概念
1.1 方向導數
這裡寫圖片描述

1.2 梯度的概念
這裡寫圖片描述

如果考慮z=f(x,y)描繪的是一座在點(x,y)的高度為f(x,y)的山。那麼,某一點的梯度方向是在該點坡度最陡的方向,而梯度的大小告訴我們坡度到底有多陡。

這裡注意看,梯度算出來是個向量,而向量用矩陣表示一般是用列表示。下面用更一般的形式寫一寫:

對於一個一維的y,對應一個二維的自變數x,函式為:y=f(x),這裡這裡寫圖片描述記住,是列向量!

對於含有n個變數的標量函式,
1.3 梯度與方向導數

函式在某點的梯度是這樣一個向量,它的方向與取得最大方向導數的方向一致,而它的模為方向導數的最大值。
1.4 梯度與等高線

函式z=f(x)在點P(x,y)的梯度的方向與過點的等高線f(x,y)=c在這點的法線的一個方向相同,且從數值較低的等高線指向數值較高的等高線,而梯度的模等於函式在這個法線方向的方向導數。這個法線方向就是方向導數取得最大值的方向。

即負梯度方向為最速下降方向

相關文章