用三張圖理解深度學習的工作原理

dicksonjyl560101發表於2018-12-17

原文網址 : http://blog.itpub.net/29829936/viewspace-2285391/

用三張圖理解深度學習的工作原理

https://www.toutiao.com/a6627243294743069192/

1 ，用三張圖理解深度學習的工作原理

現在你已經知道，機器學習是將輸入（比如影像）對映到目標（比如標籤“貓”），這一過程是通過觀察許多輸入和目標的示例來完成的。你還知道，深度神經網路通過一系列簡單的資料變換（層）來實現這種輸入到目標的對映，而這些資料變換都是通過觀察示例學習到的。下面來具體看一下這種學習過程是如何發生的。

神經網路中每層對輸入資料所做的具體操作儲存在該層的權重（weight）中，其本質是一串數字。用術語來說，每層實現的變換由其權重來引數化（parameterize，見圖 1-7）。權重有時也被稱為該層的引數（parameter）。在這種語境下，學習的意思是為神經網路的所有層找到一組權重值，使得該網路能夠將每個示例輸入與其目標正確地一一對應。但重點來了：一個深度神經網路可能包含數千萬個引數。找到所有引數的正確取值可能是一項非常艱鉅的任務，特別是考慮到修改某個引數值將會影響其他所有引數的行為。

圖 1-7　神經網路是由其權重來引數化

想要控制一件事物，首先需要能夠觀察它。想要控制神經網路的輸出，就需要能夠衡量該輸出與預期值之間的距離。這是神經網路損失函式（loss function）的任務，該函式也叫目標函式（objective function）。損失函式的輸入是網路預測值與真實目標值（即你希望網路輸出的結果），然後計算一個距離值，衡量該網路在這個示例上的效果好壞（見圖 1-8）。

圖 1-8　損失函式用來衡量網路輸出結果的質量

深度學習的基本技巧是利用這個距離值作為反饋訊號來對權重值進行微調，以降低當前示例對應的損失值（見圖 1-9）。這種調節由優化器（optimizer）來完成，它實現了所謂的反向傳播（backpropagation）演算法，這是深度學習的核心演算法。下一章中會詳細地解釋反向傳播的工作原理。

圖 1-9　將損失值作為反饋訊號來調節權重

一開始對神經網路的權重隨機賦值，因此網路只是實現了一系列隨機變換。其輸出結果自然也和理想值相去甚遠，相應地，損失值也很高。但隨著網路處理的示例越來越多，權重值也在向正確的方向逐步微調，損失值也逐漸降低。這就是訓練迴圈（training loop），將這種迴圈重複足夠多的次數（通常對數千個示例進行數十次迭代），得到的權重值可以使損失函式最小。具有最小損失的網路，其輸出值與目標值儘可能地接近，這就是訓練好的網路。再次強調，這是一個簡單的機制，一旦具有足夠大的規模，將會產生魔法般的效果。

雖然深度學習是機器學習一個相當有年頭的分支領域，但在 21 世紀前十年才崛起。在隨後的幾年裡，它在實踐中取得了革命性進展，在視覺和聽覺等感知問題上取得了令人矚目的成果，而這些問題所涉及的技術，在人類看來是非常自然、非常直觀的，但長期以來卻一直是機器難以解決的。

2， 深度學習已經取得的進展

特別要強調的是，深度學習已經取得了以下突破，它們都是機器學習歷史上非常困難的領域：

接近人類水平的影像分類
接近人類水平的語音識別
接近人類水平的手寫文字轉錄
更好的機器翻譯
更好的文字到語音轉換
數字助理，比如谷歌即時（Google Now）和亞馬遜 Alexa
接近人類水平的自動駕駛
更好的廣告定向投放，Google、百度、必應都在使用
更好的網路搜尋結果
能夠回答用自然語言提出的問題
在圍棋上戰勝人類

我們仍然在探索深度學習能力的邊界。我們已經開始將其應用於機器感知和自然語言理解之外的各種問題，比如形式推理。如果能夠成功的話，這可能預示著深度學習將能夠協助人類進行科學研究、軟體開發等活動。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29829936/viewspace-2285391/，如需轉載，請註明出處，否則將追究法律責任。

深度學習的工作原理
2019-04-07
深度學習
一張圖看懂AI、機器學習和深度學習的區別
2018-09-09
AI機器學習深度學習
三張圖理解JavaScript原型鏈
2020-08-16
JavaScript原型
22張精煉圖筆記，深度學習專項學習必備
2019-12-30
筆記深度學習
自我學習與理解：keras框架下的深度學習（三）迴歸問題
2021-12-27
Keras框架深度學習
深入理解深度學習
2020-11-14
深度學習
Activiti工作流學習筆記(三)——自動生成28張資料庫表的底層原理分析
2021-03-13
筆記資料庫
深入理解JS中的物件（三）：class 的工作原理
2020-05-18
JS物件
C#中的深度學習（三）：理解神經網路結構
2020-12-23
C#深度學習神經網路
如何理解雅克比矩陣在深度學習中的應用？
2021-10-23
矩陣深度學習
用於HPC和深度學習工作負載的容器技術
2018-05-07
深度學習負載
深度學習和圖形學渲染的結合和應用
2022-05-28
深度學習
Webpack學習－工作原理（上）
2019-02-17
Web
Webpack學習－工作原理（下）
2021-09-09
Web
讓 PM 全面理解深度學習
2019-08-07
深度學習
深度學習新星：GAN的基本原理、應用和走向
2018-09-10
深度學習
一張圖學習常見this的指向
2018-03-16
深度學習及深度強化學習應用
2021-01-04
深度學習強化學習
樸素貝葉斯深度解碼：從原理到深度學習應用
2023-11-17
深度學習
深度學習 SSD的理解和細節分析
2019-05-06
深度學習
一張圖說清AI、機器學習和深度學習在企業中作用 - 知乎
2021-11-24
AI機器學習深度學習
理解Transformer [資料探勘深度學習]
2024-04-24
ORM深度學習
用一個實際例子理解Dockervolume工作原理
2018-11-23
Docker
零基礎入門深度學習工作原理？看本文就對了！
2018-05-30
深度學習
學習Java的9張思維導圖
2019-03-31
Java
深度理解C# 的執行原理
2018-10-19
C#
Linux從頭學06：16張結構圖，徹底理解【程式碼重定位】的底層原理
2021-08-11
Linux
林三心畫了8張圖，最通俗易懂的Vue3響應式核心原理解析
2021-12-31
Vue
用一個實際例子理解Docker volume工作原理
2018-11-27
Docker
乾貨：HashMap的工作原理解析
2019-03-04
HashMap
深度學習已成功應用於這三大領域
2019-11-04
深度學習
深度學習機器學習基礎-基本原理
2023-01-17
深度學習機器學習
深度學習-理論學習關鍵示意圖
2020-10-03
深度學習
深入理解HTTPS工作原理
2019-04-26
HTTP
[譯] 深度學習能力的三個等級
2019-05-05
深度學習
“深度學習三巨頭”來了倆，Hinton、LeCun預言深度學習的未來
2019-06-28
深度學習LeCun
一張圖理解 JS 中的原型鏈
2019-03-08
JS原型
深入瞭解Azure 機器學習的工作原理
2022-03-17
機器學習

用三張圖理解深度學習的工作原理

相關文章