一文讀懂深度學習中的矩陣微積分
點選視學演算法標星,更快獲取CVML新技術
魚羊 編譯整理
量子位 報導 | 公眾號 QbitAI
想要真正瞭解深度神經網路是如何訓練的,免不了從矩陣微積分說起。
雖然網路上已經有不少關於多元微積分和線性代數的線上資料,但它們通常都被視作兩門獨立的課程,資料相對孤立,也相對晦澀。
不過,先別打退堂鼓,來自舊金山大學的Terence Parr教授說:矩陣微積分真的沒有那麼難。
這位ANTLR之父和fast.ai創始人Jeremy Howard一起推出了一篇免費教程,旨在幫你快速入門深度學習中的矩陣微積分。簡明,易懂。
DeepMind研究科學家Andrew Trask評價說:
如果你想跳過不相干的內容,一文看盡深度學習中所需的數學知識,那麼就是這份資源沒錯了。
只需一點關於微積分和神經網路的基礎知識,就能單刀直入,開始以下的學習啦。
深度學習所需的矩陣微積分
先來看一眼這篇教程都涵蓋了哪些內容:
基本概念
矩陣微積分
神經元啟用的梯度
神經網路損失函式的梯度
文章開篇,先介紹了一下人工神經元。
神經網路中單個計算單元的啟用函式,通常使用權重向量w與輸入向量x的點積來計算。
神經網路由許多這樣的單位組成。它們被組織成稱為層的神經元集合。上一層單元的啟用成為下一層單元的輸入,最後一層中一個或多個單元的啟用稱為網路輸出。
訓練神經元意味著對權重w和偏差b的選擇。我們的目標是逐步調整w和b,使總損失函式在所有輸入x上都保持較小。
導數規則、向量計算、偏導數……複習完需要掌握的先導知識,文章開始進入重要規則的推導,這些規則涉及向量偏導數的計算,是神經網路訓練的基礎。
比如在矩陣微積分這一節中,涵蓋:
雅可比式(Jacobian)的推廣
向量element-wise二元運算元的導數
涉及標量展開的導數
向量和降維
鏈式法則
每一小節中,都有簡潔明瞭的示例,由淺入深,層層遞進。
如果你在學習的過程中遇到不理解的地方,不要著急,耐心返回上一節閱讀,重新演算一下文中的示例,或許就能理順思路。
如果實在是卡住了無法推進,你還可以在fast.ai論壇(連結見文末)的“Theory”分類下提問,向Parr和Howard本人求解答。
而在文章的末尾,作者附上了所有數學符號的對照表。
以及重點概念的詳細補充資訊。
值得注意的是,Parr和Howard也強調了,與其他學術方法不同,他們強烈建議先學會如何訓練和使用神經網路,然後再深入瞭解背後的基礎數學。因為有了實踐經驗,數學會變得剛容易理解。
傳送門
網頁版:
https://explained.ai/matrix-calculus/index.html
PDF:
https://arxiv.org/abs/1802.01528
在我愛計算機視覺公眾號後臺回覆“矩陣微積分”,即可收到PDF下載地址。
fast.ai論壇:
http://forums.fast.ai/
作者系網易新聞·網易號“各有態度”簽約作者
- END -
如果看到這裡,說明你喜歡這篇文章,請轉發、點贊。掃描下方二維碼或者微信搜尋「perfect_iscas」,新增好友後即可獲得10套程式設計師全棧課程+1000套PPT和簡歷模板,向我私聊「進群」二字即可進入高質量交流群。
↓掃描二維碼進群↓
喜歡文章,點個在看
相關文章
- 深度學習很難?一文讀懂深度學習!深度學習
- 深度學習中需要的矩陣計算深度學習矩陣
- 獲贊2萬,一文讀懂深度學習深度學習
- 一文讀懂深度學習:從神經元到BERT深度學習
- 讀懂深度學習,走進“深度學習+”階段深度學習
- 一文讀懂機器學習中的模型偏差機器學習模型
- 如何理解雅克比矩陣在深度學習中的應用?矩陣深度學習
- 一文讀懂人工智慧、機器學習、深度學習、強化學習的關係(必看)人工智慧機器學習深度學習強化學習
- 一文讀懂微核心
- 學習筆記:微積分筆記
- 機器學習中的矩陣向量求導(五) 矩陣對矩陣的求導機器學習矩陣求導
- 一文讀懂機器學習中的貝葉斯統計學機器學習
- 深度學習助力資料壓縮,一文讀懂相關理論深度學習
- 卷積為什麼如此強大?一文全解深度學習中的卷積卷積深度學習
- 一文帶你瞭解深度學習中的各種卷積(上)深度學習卷積
- 一文帶你瞭解深度學習中的各種卷積(下)深度學習卷積
- 一文讀懂遷移學習(附學習工具包)遷移學習
- 一文讀懂計算機視覺中的深度域適應計算機視覺
- 一文讀懂微搭低程式碼
- 演算法學習:矩陣快速冪/矩陣加速演算法矩陣
- 《普林斯頓微積分讀本》中的一處問題
- 【動手學深度學習】2.4 ~ 2.7 節學習(微積分、自動求導、機率、查閱文件)深度學習求導
- 讀懂本文讓你和深度學習模型“官宣”深度學習模型
- 一文讀懂Python中的對映Python
- 機器學習數學知識積累之高等數學微積分機器學習
- 一文秒懂!“人工智慧、機器學習、深度學習”傻傻分得清人工智慧機器學習深度學習
- 跟我一起學《深度學習》 第二章 線性代數(2.3 單位矩陣和逆矩陣)深度學習矩陣
- 一文讀懂機器學習大殺器XGBoost原理機器學習
- 機器學習中的矩陣向量求導(四) 矩陣向量求導鏈式法則機器學習矩陣求導
- C# 入門深度學習:萬字長文講解微積分和梯度下降C#深度學習梯度
- 一文讀懂Java中的動態代理Java
- 【微積分】不定積分
- 迴歸演算法全解析!一文讀懂機器學習中的迴歸模型演算法機器學習模型
- 【矩陣求導】關於點乘 (哈達瑪積)的矩陣求導矩陣求導點乘
- 自然數學-微積分的定義
- 深度學習程式碼積累深度學習
- 形函式,等參單元,雅克比矩陣,高斯積分函式矩陣
- 【numpy學習筆記】矩陣操作筆記矩陣