機器學習之簡單介紹啟用函式

swensun發表於2018-04-09

原文網址 : https://juejin.im/post/5acb382d6fb9a028d043bde7

機器學習函式

Activation funcation 啟用函式

啟用函式將神經網路最後一層輸出當做輸入，進行轉換。也用於神經網路兩層之間。
那麼在神經網路為什麼要使啟用函式？
比如在邏輯迴歸中，用於將輸出轉換為0/1進行分類。在神經網路中用於確定輸出是yes/no。或者將輸出對映到某一個範圍之間，比如手寫數字識別中，將輸出對映到0--9之間。

啟用函式一般分類兩類:線性和非線性

線性或恆等啟用函式

機器學習之簡單介紹啟用函式

如上函式，該輸出不會限制在任何範圍內，與上述我們的目的不相符。

非線性啟用函式

機器學習之簡單介紹啟用函式

如上就是非線性啟用函式的例子，在神經網路中用的最多。它是模型易於泛化或者適應各種資料，並對輸出進行區分。對啟用函式有幾個術語需要了解： 導數或者微分：當優化方法與梯度相關時，需要求導，因此函式必須可微。 單調性：當啟用函式是單調時，單層網路能夠保證是凸函式。 輸出值的範圍：當啟用函式輸出值是有限的時候，基於梯度的優化方法會更加穩定，因為特徵的表示受有限權值的影響更顯著；當啟用函式的輸出是無限的時候，模型的訓練會更加高效，不過在這種情況小，一般需要更小的learning rate.

下面介紹幾種常見的啟用函式：

sigmoid 函式

機器學習之簡單介紹啟用函式

如上，輸出永遠在0--1之間，其中在接近0或者1時，變化速度變慢。在模型預測可能性時有用。該函式可微，因此在兩點之間可以計算斜率。該函式單調但是其導函式不是單調的。該啟用函式會導致神經網路在訓練時被卡住，部分缺點如下：

當輸入過大過小時，梯度接近0.因此初始值很大時，神經元梯度會消失，加大訓練難度。
該函式輸出的均值不為0。因此後一層神經元將上一層的非0輸出作為訊號輸入，梯度始終為正。

Tanh 雙曲正弦啟用函式

機器學習之簡單介紹啟用函式

與sigmoid類似，但是比sigmoid效果要好，輸出在-1--1之間。不同與sigmoid，該函式輸出均值為0. 常用於二分類問題。

Relu(線性整流)啟用函式

機器學習之簡單介紹啟用函式

目前這是在神經網路中用的最多的啟用函式，大部分卷積神經網路和深度神經網路在在使用。如上，該範圍在0--無窮大之間。其中該函式和其倒數都是單調的。部分優點如下：

收斂速度相比於sigmoid和Tanh要快很多
相比於sigmoid和Tanh，由於函式特性，只需要一個閾值就能得到啟用值同時也有缺點，比如一個非常大的梯度流過一個Relu神經元時，更新引數以後，由於啟用值太大，導致對後面的資料啟用困難。

Softmax 啟用函式

機器學習之簡單介紹啟用函式

softmax用於多分類過程中，它將多個神經元的輸出，對映到（0,1）區間內，可以看成概率來理解，從而來進行多分類！

上述中為什麼會提到導數或者可微：當在梯度下降中更新梯度時，需要知道曲線的斜率，並進行更新，因為這是下降最快的方向。因此在神經網路中需要使用到啟用函式的導數。

相關文章

機器學習基本函式介紹
2020-12-05
機器學習函式
match函式簡單介紹以及與index函式結合應用
2018-08-20
函式Index
元學習簡單介紹
2020-10-06
[譯] 機器學習可以建模簡單的數學函式嗎？
2019-05-04
機器學習函式
機器學習入門之sklearn介紹
2019-03-05
機器學習
簡單介紹JS函式防抖和函式節流
2021-05-28
JS函式
【機器學習】機器學習簡介
2018-11-29
機器學習
（一）機器學習和機器學習介紹
2021-09-09
機器學習
簡單介紹python的input,print,eval函式
2022-12-17
Python函式
簡單介紹Python 如何擷取字元函式
2023-04-17
Python字元函式
機器學習之GBDT(簡單理解)
2018-03-05
機器學習
機器學習簡介
2024-08-25
機器學習
函子的簡單介紹
2020-11-08
深度學習（啟用函式）
2024-08-17
深度學習函式
【機器學習】多項式迴歸原理介紹
2019-03-10
機器學習
簡單介紹Python中的配對函式zip()
2023-04-23
Python函式
簡單介紹SQL中ISNULL函式使用方法
2022-01-11
SQLNull函式
自動駕駛中的機器學習演算法簡單介紹 - Haltakov
2021-04-22
自動駕駛機器學習演算法
常見啟用函式的介紹和總結
2020-08-10
函式
阿里雲機器學習 AutoML 引擎介紹與應用
2023-02-23
阿里機器學習TOML
最通俗的機器學習介紹
2018-09-03
機器學習
[大資料][機器學習]之Model Card（模型卡片）介紹
2024-07-09
大資料機器學習模型
學習筆記-React的簡單介紹&工作原理
2021-10-23
筆記React
實用函式式 Java （PFJ）簡介
2021-11-12
函式Java
Python之函式的相關介紹
2021-09-11
Python函式
機器學習基本概念簡介
2024-04-15
機器學習
人工智慧-機器學習簡介
2020-08-23
人工智慧機器學習
《Python機器學習實踐》簡介
2022-09-02
Python機器學習
【機器學習】李宏毅——機器學習基本概念簡介
2022-12-14
機器學習
Lucene介紹及簡單應用
2020-04-05
Java正規表示式簡單介紹
2018-08-18
Java
Python 偏函式介紹及應用
2020-05-26
Python函式
stoi函式介紹
2024-11-16
函式
機架式伺服器的簡單介紹及其優點
2023-03-08
伺服器
簡單的介紹伺服器和Ajax的應用
2020-10-27
伺服器
【機器學習基礎】半監督學習簡介
2021-12-23
機器學習
C++移動建構函式以及move語句簡單介紹
2018-11-28
C++函式
簡單介紹python函式超時自動退出的實操方法
2021-01-05
Python函式