高博14講中P110頁一二階梯度法的相關理解
高博14將在110頁的6.2.1中寫到:
前面定義好的目標函式:
求解增量最直觀的方式是將目標函式在x附近進行泰勒展開:
這裡J是目標函式關於x的導數(雅克比矩陣),而H則是二階導數(海塞[hessian]矩陣)。我們可以選擇保留泰勒展開的一階二階項,對應的求解方法則為一階梯度或二階梯度法。如果保留一階梯度,那麼增量的解就為:
它的直觀意義非常簡單,只要我們沿著反向梯度方向前進即可。通常我們還會計算該方向上的一個步長,求得最快的下降方式。這種方法被稱為最速下降法。
這裡有幾個問號臉(數學比較渣導致的):
1、J(x)是如何定義的?
2、增量的解怎麼求出來的?
3、增量的解為什麼有個轉置T?
4、梯度是什麼?
1、基本概念
1.1 方向導數
1.2 梯度的概念
如果考慮z=f(x,y)描繪的是一座在點(x,y)的高度為f(x,y)的山。那麼,某一點的梯度方向是在該點坡度最陡的方向,而梯度的大小告訴我們坡度到底有多陡。
這裡注意看,梯度算出來是個向量,而向量用矩陣表示一般是用列表示。下面用更一般的形式寫一寫:
對於一個一維的y,對應一個二維的自變數x,函式為:y=f(x),這裡記住,是列向量!
對於含有n個變數的標量函式,
1.3 梯度與方向導數
函式在某點的梯度是這樣一個向量,它的方向與取得最大方向導數的方向一致,而它的模為方向導數的最大值。
1.4 梯度與等高線
函式z=f(x)在點P(x,y)的梯度的方向與過點的等高線f(x,y)=c在這點的法線的一個方向相同,且從數值較低的等高線指向數值較高的等高線,而梯度的模等於函式在這個法線方向的方向導數。這個法線方向就是方向導數取得最大值的方向。
即負梯度方向為最速下降方向
相關文章
- 理解socket.io(一)---相關的APIAPI
- 關於 一合相 的再進一步的理解。
- HTML5中與頁面顯示相關的APIHTMLAPI
- 一合相的理解
- JS 相關寬高理解JS
- 梯度累計講解-支援更大的batch梯度BAT
- 關於CSS中設定overflow屬性的值為hidden的相關理解CSS
- 誰能講解一下ThreadLocal類的相關知識!thread
- 視覺SLAM十四講第九講 執行程式中碰到的shared libraries相關的坑。視覺SLAM行程
- 這是一段講述ejb限制的文章以及相關的中文文章,請問怎麼理解每一條約束。
- 網頁中Office和pdf相關檔案匯出網頁
- ES6的相關語法
- 關於Dart中Future的一些理解Dart
- 關於Swift中Properties的一些理解Swift
- 頁面佈局的相關內容
- Swift中的ARC相關Swift
- ZBlog首頁與列表頁相關模板
- 原碼反碼補碼的相關理解
- 深入瞭解網站中的靜態網頁和動態網頁的相關知識網站網頁
- 關於2PC(二階段提交)和3PC(三階段提交)的理解
- P110 III
- 關於gcc,libc,glibc等相關概念的理解GC
- 強化學習-學習筆記14 | 策略梯度中的 Baseline強化學習筆記梯度
- 一文清晰講解機器學習中梯度下降演算法(包括其變式演算法)機器學習梯度演算法
- Python相關語法2Python
- 一頁解決字串常量池相關疑難雜症字串
- bang的設計模式講解中的不理解的一個問題設計模式
- PostgreSQL叢集方案相關索引頁SQL索引
- 無法訪問請求的頁面,因為該頁的相關配置資料無效問題的解決
- Oracle GoldenGate相關講解及安裝OracleGo
- css中關於table的相關設定CSS
- AmS中的一些重要排程相關變數變數
- 聊一聊JavaScript中的嚴格模式與相關的‘坑’JavaScript模式
- JVM相關 - 深入理解 System.gc()JVMGC
- 對梯度下降演算法的理解和實現梯度演算法
- CBO的相關原理 系列一
- web.xml中的servlet相關WebXMLServlet
- C++ 3/5 法則相關C++