漫畫版:什麼是神經網路?

Momomo發表於2020-03-30

本文來自 Youtube 上的一段 5 分鐘的漫畫版視訊。這段關於“什麼是神經網路”的視訊對神經網路的概念進行了有趣的介紹。我們將學習神經網路中存在的不同層,並瞭解這些層如何處理資料。我們將瞭解神經網路中使用的不同引數,如權重、偏差和啟用函式。我們還將瞭解如何使用正向傳播訓練神經網路,然後使用反向傳播方法調整網路中的誤差。本視訊還涵蓋了一些流行的神經網路應用。現在,讓我們直接開始學習什麼是神經網路。

介紹

去年夏天,我們全家去了俄羅斯,儘管我們都不會俄語,但因為 Google 能將俄語實時翻譯成英語,我們的出行沒有遇到任何麻煩。

image.png

這只是神經網路的應用之一, 還應用於人臉識別、音樂創作等。

image.png

神經網路是深度學習的基礎,深度學習是機器學習的一個子領域,其演算法受人腦結構的啟發而來。

image.png

神經網路通過對大量資料進行訓練以識別這些資料中的特徵,學習到的模型用來預測一組新的相似資料。

image.png

原理

我們來構造一個區分正方形、圓形和三角形的神經網路,以瞭解神經網路是如何工作的。

神經網路由一層層神經元組成,這些神經元是網路的核心處理單元。首先,我們有一個輸入層(Input Layer)來接收輸入,輸出層(Output Layer)是我們的預測的最終輸出,在它們之間存在執行我們網路所需的大多數計算的隱含層(Hidden Layers)。

1neuran.gif

這是一個圓形影像,該影像由 28 x 28 畫素組成,佔 784 畫素。每個畫素作為輸入饋送到第一層的每個神經元,這一層的神經元通過通道連線到下一層的神經元。這些通道中的每個通道都分配了一個稱為權重(weight)的數值,將輸入乘以相應的權重,並將它們的總和作為輸入傳送到隱藏層中的神經元。這些神經元都有一個稱為偏差(bias)的數值與之關聯,將偏差新增到輸入總和中。然後將此值通過稱為啟用函式(Activation Function)的閾值函式傳遞,啟用函式的輸出結果確定特定神經元是否將被啟用。啟用的神經元通過通道將資料傳輸到下一層的神經元。

資料以這種方式通過網路傳播,這稱為前向傳播(Forward Propagation)。

在輸出層中,具有最高值的神經元觸發並確定輸出,這些值基本上是一個概率值。

forward-propagation.gif

當然,我們一看就知道這裡的神經網路做出了錯誤的預測,那麼神經網路如何解決呢?請注意,到這裡我們的神經網路還沒有接受訓練。

在這個訓練過程中,和輸入一樣將輸出也饋送給神經網路。將預測輸出與實際輸出進行比較以得到預測中的誤差,誤差的大小表示錯誤程度,符號表示我們的預測值高於或低於預期,此處的箭頭表示需要改變方向和幅度以減少誤差。

image.png

然後,將此資訊通過神經網路向後傳輸,這稱為反向傳播。向前傳播和向後傳播的迴圈是通過多次輸入迭代執行的,在此過程中調整權重,一直持續到分配的權重使神經網路可以正確預測形狀為止。

backpropagation.gif

這裡當預測為圓形的準確率達到 0.9 時, 大多數情況下,我們的訓練過程就結束了。

image.png

您可能想知道這個訓練過程需要花多長時間,說實話,神經網路可能要花費數小時甚至數月的時間。所以在選擇使用神經網路來訓練時,需要權衡一下所需要的訓練時間。

image.png

應用

讓我們看一下神經網路的一些主要應用。

人臉識別

如今,智慧手機上的攝像頭可以根據人的面部表情來預測其年齡特徵。這是神經網路的作用,首先把臉和背景區分開,然後把臉上的線條和斑點與可能的年齡聯絡起來。

image.png

預測

訓練神經網路以瞭解規律,例如高精度的預測降雨或股票的價格和趨勢。

image.png

音樂創作

神經網路甚至可以學習音樂,並訓練自己譜寫一首新的曲子。

image.png

未來

藉助深度學習和神經網路,我們只邁出了一小步。

image.png

一些大公司已經預見了該領域的增長,Google,Amazon 和 Nvidia 等公司已經投資開發了支援實現神經網路的產品,例如庫,預測模型和直觀的GPU。

image.png

那麼我們可以在多大程度上覆制人類的大腦?得再等幾年給出明確的答案。

image.png

小測驗

所以這裡有個問題要問你。下列哪項陳述不成立?

A、 啟用函式是閾值函式
B、 在神經網路的每一層計算誤差
C、 前向和後向傳播都發生在神經網路的訓練過程中
D、 大多數資料處理是在隱藏層中進行的


image.png
正確答案是選項 B。

說明:在神經網路中,模型中的誤差總是在得到預測輸出後計算,即在網路的輸出層。將預測的輸出與模型的實際輸出進行比較。在網路中執行反向傳播演算法,並優化權值以減小模型中的誤差。此過程重複多次以獲得最終輸出,使誤差最小。

相關文章