【人工神經網路基礎】為什麼神經網路選擇了“深度”？

wuliytTaotao發表於2018-09-05

原文網址 : https://flycode.co/archives/252543

　　現在提到“神經網路”和“深度神經網路”，會覺得兩者沒有什麼區別，神經網路還能不是“深度”（deep）的嗎？我們常用的 Logistic regression 就可以認為是一個不含隱含層的輸出層啟用函式用 sigmoid（logistic）的神經網路，顯然 Logistic regression 就不是 deep 的。不過，現在神經網路基本都是 deep 的，即包含多個隱含層。Why？

1. universality approximation theorem（通用近似定理）

　　任何連續的函式 $f: R^N \to R^M$ 都可以用只有一個隱含層的神經網路表示。（隱含層神經元足夠多）

圖 1：僅含一個隱含層的神經網路示意圖

　　一個神經網路可以看成是一個從輸入到輸出的對映，那麼既然僅含一個隱含層的神經網路可以表示任何連續的函式，為什麼還要多個隱含層的神經網路？

2. why deep？

　　"Yes, shallow network can represent any function.

　　However, using deep structure is more effective."

　　我們可以把僅含一個隱含層的神經網路結構叫做 shallow 的，把包含多個隱藏層的神經網路結構叫做 deep 的。

　　李宏毅教授在他的機器學習視訊中，提出一種叫做 Modularization（模組化）的解釋。

圖 2：Modularization

　　在多層神經網路中，第一個隱含層學習到的特徵是最簡單的，之後每個隱含層使用前一層得到的特徵進行學習，所學到的特徵變得越來越複雜。如圖 3 和 4 所示。

圖 3：不同level的特徵-1

　　low level 中每一個特徵在 high level 或多或少被使用，這樣對於每一個 high level 特徵，只需要訓練一套 low level 特徵。是的，low level 特徵被共用了，相當於將提取 low level 特徵單獨成立了一個模組，供高層呼叫。對於每一個 high level 特徵，不需要每次都將 low level 特徵訓練一遍。這就是 deep 的好處。

圖 4：不同level特徵-2

　　在比較深度神經網路和僅含一個隱含層神經網路的效果時，需要控制兩個網路的 trainable 引數數量相同，不然沒有可比性。李宏毅教授在他的機器學習視訊中舉例，相同引數數量下，deep 表現更好；這也就意味著，達到相同的效果，deep 的引數會更少。

　　不否認，理論上僅含一個隱含層的神經網路完全可以實現深度神經網路的效果，但是訓練難度要大於深度神經網路。

　　實際上，在深度神經網路中，一個隱含層包含的神經元也不少了，比如 AlexNet 和 VGG-16 最後全連線層的 4096 個神經元。在 deep 的同時，fat 也不是說不需要，只是沒有像只用一層隱含層那麼極端，每個隱含層神經元的個數也是我們需要調節的超引數之一。

References

李宏毅機器學習

Universal approximation theorem - Wikipedia

深度學習教程 | 神經網路基礎
2022-04-15
深度學習神經網路
神經網路基礎篇
2021-08-30
神經網路
神經網路基礎知識
2024-11-08
神經網路
【深度學習基礎-07】神經網路演算法（Neural Network）上--BP神經網路基礎理論
2019-01-10
深度學習神經網路演算法
人工神經網路初學：是什麼以及為什麼？
2018-08-15
神經網路
7、卷積神經網路基礎
2024-10-02
卷積神經網路
使用深度神經網路為什麼8位足夠？
2021-07-17
神經網路
人工神經網路（ANN）
2023-10-07
神經網路
神經網路基礎及Keras入門
2018-11-21
神經網路Keras
Ng深度學習筆記——卷積神經網路基礎
2020-11-08
深度學習筆記卷積神經網路
吳恩達《卷積神經網路》課程筆記（1）– 卷積神經網路基礎
2018-08-02
吳恩達卷積神經網路筆記
吳恩達《神經網路與深度學習》課程筆記（2）– 神經網路基礎之邏輯迴歸
2018-07-29
吳恩達神經網路深度學習筆記邏輯迴歸
吳恩達《神經網路與深度學習》課程筆記（3）– 神經網路基礎之Python與向量化
2018-07-29
吳恩達神經網路深度學習筆記Python
3.4 神經網路為什麼這麼強
2019-12-31
神經網路
【深度學習篇】--神經網路中的卷積神經網路
2018-03-28
深度學習神經網路卷積
人工智慧教程 - 1.1.1 什麼是神經網路
2019-04-10
人工智慧神經網路
白話深度神經網路
2019-08-20
神經網路
神經網路基礎部件-BN層詳解
2023-02-10
神經網路
人工智慧的神經網路到底是什麼？
2019-06-20
人工智慧神經網路
神經網路：numpy實現神經網路框架
2021-08-19
神經網路框架
人工智慧 (11) 神經網路
2019-12-23
人工智慧神經網路
深度剖析卷積神經網路
2018-05-23
卷積神經網路
如何優化深度神經網路？
2019-08-06
優化神經網路
神經網路基礎部件-卷積層詳解
2023-02-16
神經網路卷積
神經網路
2018-11-30
神經網路
人工神經網路-2020-第十四周-人工神經網路硬體實現-備課
2020-12-16
神經網路
深度學習之Pytorch（一）神經網路基礎及程式碼實現
2020-10-08
深度學習PyTorch神經網路
最簡單的人工神經網路
2021-08-25
神經網路
MATLAB人工神經網路ANN程式碼
2023-02-09
Matlab神經網路
神經網路基礎部件-損失函式詳解
2023-01-13
神經網路函式
再聊神經網路與深度學習
2019-04-08
神經網路深度學習
AI之（神經網路+深度學習）
2018-05-31
AI神經網路深度學習
【深度學習】神經網路入門
2020-04-04
深度學習神經網路
深度學習與圖神經網路
2022-09-15
深度學習神經網路
漫畫版：什麼是神經網路？
2020-03-30
神經網路
聊聊從腦神經到神經網路
2018-11-29
神經網路
LSTM神經網路
2019-03-02
神經網路
8、神經網路
2020-12-18
神經網路

【人工神經網路基礎】為什麼神經網路選擇了“深度”？

1. universality approximation theorem（通用近似定理）

2. why deep？

References

相關文章