一個故事看懂AI神經網路工作原理

軒轅之風發表於2020-10-14

原文網址 : https://www.cnblogs.com/xuanyuan/p/13812976.html

AI神經網路

我是一個AI神經元

我是一個AI神經元，剛剛來到這個世界上，一切對我來說都特別新奇。

之所以叫這個名字，是因為我的工作有點像人類身體中的神經元。

人體中的神經元可以傳遞生物訊號，給它輸入一個訊號，它經過處理後再輸出一個訊號傳遞給別的神經元，最終傳遞到大腦完成對一個訊號的決策和處理。

聰明的電腦科學家們受到啟發，在程式碼程式裡發明了我：神經元函式。

在我們的世界裡，我只是普普通通的一員，像我這樣的神經元有成百上千，甚至上萬個，我們按照層的形式，組成了一個龐大的神經網路。

很快我和隔壁工位的大白開始混熟了，他比我來得早，對這裡要熟悉的多。

聽大白告訴我說，我們這個神經網路是一個影像識別的AI程式，只要給我們輸入一張狗的照片，我們就能告訴你這是一隻柯基，還是泰迪、柴犬、二哈···

神經元結構

在大白的指引下，我很快就學會了怎麼工作。

雖然我們叫神經元，名字聽起來挺神祕的，但實際上我就是一個普通函式，有引數，有返回值，普通函式有的我都有：

def neuron(a):
  w = [...]
  b = ...
  ...

我有一個引數a，這個引數是一個陣列，裡面的每一個元素我把它分別叫做a1，a2，a3···用這個a來模擬我這個神經元收到的一組訊號。

人類的神經元是怎麼處理輸入的生物訊號我不知道，我估計挺複雜的。但在我這裡就很簡單:我給每一個輸入值設定一定的權重，然後做一個簡單的加權求和，最後再加上一個偏移值就行啦！

所以我還有一個陣列叫做w，就是權重weight的意思，裡面的每一個元素我叫做w1，w2，w3···，至於那個偏移值，就叫它bias。

如此一來我的工作你們也該猜到了，就是把傳進來的a裡面的每個元素和w裡的每一個元素做乘法，再加起來，最後加上偏移值，就像這樣：

說到這裡，我突然想到一個問題，打算去問問大白。

“大白，這些要計算的資料都是從哪裡來的呢？”

“是上一層的神經元們送過來的”

“那他們的資料又是哪來的呢？”，我刨根問題的問到。

大白帶我來到了門口，指向另外一個片區說到，“看到了嗎？那裡是資料預處理部門，他們負責把輸入的圖片中的畫素顏色資訊提取出來，交給我們神經網路部門來進行分析。”

“交給我們？然後呢”

“我們們這個神經網路就像一臺精密的機器，我們倆只是其中兩個零件，不同的權重值某種意義上代表了對圖片上不同位置的畫素關心程度。一旦開動起來，餵給我們圖片資料，我們每一個神經元就開始忙活起來，一層層接力，把最終的結果輸出到分類器，最終識別出狗的品種。”

神經網路訓練

正聊著，突然，傳來一陣廣播提示音，大家都停止了閒聊，回到了各自工位。

“這是要幹啥，這麼大陣仗？”，我問大白。

“快坐下，馬上要開始訓練了”，大白說到。

“訓練？訓練什麼？”

“我們們用到的那些權重值和偏移值你以為怎麼來的？就是通過不斷的訓練得出來的。”

還沒說到幾句話，資料就開始送過來了。按照之前大白教給我的，我將輸入資料分別乘以各自的權重，然後相加，最後再加上偏移bias，就得到了最後的結果，整個過程很輕鬆。

我準備把計算結果交給下一層的神經元。

大白見狀趕緊制止了我，“等一下！你不能直接交出去”

“還要幹嘛？”

大白指了一下我背後的另一個傢伙說到：“那是啟用函式，得先交給他處理一下”

“啟用函式是幹嘛的？”，我問大白。

“啟用，就是根據輸入訊號量的大小去啟用產生對應大小的輸出訊號。這是在模仿人類的神經元對神經訊號的反應程度大小，好比拿一根針去刺皮膚，隨著力道的加大，身體的疼痛感會慢慢增強，差不多是一個道理。”

聽完大白的解釋，我點了點頭，好像明白了，又好像不太明白。

後來我才知道，這啟用函式還有好幾種，經常會打交道的有這麼幾個：

sigmoid

tanh

relu

leaky relu

啟用函式處理完後，總算可以交給下一層的神經元了，我準備稍事休息一下。

剛坐下，就聽到大廳的廣播：

隨後，又來了一組新的資料，看來我是沒時間休息了，趕緊再次忙活了起來。

這一忙不要緊，一直搞了好幾個小時，來來回回重複工作了幾萬次，我都快累癱了。

損失函式 & 優化方法

趁著休息的空當，我又和大白聊了起來。

“大白，剛剛我們們這麼來來回回折騰了幾萬次，這是在幹啥啊？”

大白也累的上氣不接下氣，緩了緩才說到：“這叫做網路訓練，通過讓我們分析大量不同品種狗的圖片，讓我們訓練出合適的權重和偏移值，這樣，我們就變得會認識狗品種了，以後正式工作的時候給我們新的狗的圖片，我們們也能用學到的知識去分辨啦"

“那到底是怎麼訓練的，你給我說說唄”，我繼續問到。

“你剛才也看到了，廣播裡不斷通知更新權重和偏移值。這訓練就是通過不斷的嘗試修改每一層神經元的權重值和偏移值，來不斷優化，找到最合適的數值，讓我們對狗的種類識別準確率最好！”，大白說到。

“不斷嘗試修改？這麼多神經元，難不成看運氣瞎碰？”

大白給了我一個白眼，“怎麼可能瞎試，那得試到猴年馬月去了。我們們這叫深度學習神經網路，是能夠自學習的！”

他這麼一說我更疑惑了，“怎麼個學習法呢？”

“其實很簡單，我們們先選一組權重偏移值，做一輪圖片識別，然後看識別結果和實際結果之間的差距有多少，把差距反饋給我們們後，再不斷調整權重和偏移，讓這個差距不斷縮小，直到差距接近於0，這樣我們們的識別準確率就越接近100%”

“額，聽上去好像很簡單，不過我還有好多問題啊。怎麼去衡量這個差距呢？具體怎麼調整權重偏移呢？調整幅度該多大好呢？”，我小小的腦袋一下冒出了許多的問號。

大白臉上露出了不可思議的表情，“小夥子，不錯嘛！你一下問出了神經網路的三個核心概念。”

“是哪三個？快給我說說”

大白喝了口水，頓了頓接著說到，“首先，怎麼去衡量這個差距？這個活，我們們部門有個人專門幹這活，他就是損失函式，他就是專門來量化我們們的輸出結果和實際結果之間的差距。量化的辦法有很多種，你空了可以去找他聊聊”

“那第二個呢？”

“第二個，具體怎麼調整，這也涉及到我們們神經網路中一個核心概念，他就是優化方法，我們們部門用的最多的是一個叫梯度下降的方法。那玩意兒有點複雜，一時半會兒給你說不清楚，大概差不多就是用求導數的方式尋找如何讓損失函式的損失值變小”，大白繼續耐心的解釋著。

“好吧，那第三個核心概念是什麼？”

“你剛不是問調整幅度嗎？這個調整幅度太小了不行，這樣我們們訓練的太慢了，那得多訓練很多回。太大了也不行，要是一不小心錯過了那個最優值，損失函式的結果就會來回搖擺，不能收斂，所以有一個叫學習速率的數值，通常需要程式設計師們憑藉經驗去設定”

我還沉浸在大白的講解中，廣播聲再次響起：

看來程式設計師修改了學習速率，我只好打起精神，繼續去忙了，真不知道何時才能訓練達標啊～

往期TOP5文章

我是Redis，MySQL大哥被我害慘了！

CPU明明8個核，網路卡為啥拼命折騰一號核？

因為一個跨域請求，我差點丟了飯碗

完了！CPU一味求快出事兒了！

雜湊表哪家強？幾大程式語言吵起來了！

一文看懂神經網路工作原理
2018-12-14
神經網路
一個故事看懂記憶體條工作原理
2021-03-02
記憶體
一文看懂卷積神經網路
2020-10-07
卷積神經網路
一個故事看懂機械硬碟原理
2021-07-20
硬碟
一個故事看懂HTTPS
2021-08-10
HTTP
神經網路是如何工作的？
2023-12-12
神經網路
一個故事講完CPU的工作原理
2020-02-05
用一個畫素攻陷神經網路
2018-10-14
神經網路
神經網路原理的視覺化
2018-05-09
神經網路視覺化
AI之（神經網路+深度學習）
2018-05-31
AI神經網路深度學習
深度神經網路成長記：帶你瞭解它的工作原理！
2019-02-15
神經網路
一個故事看懂CPU的TLB
2021-09-28
一文看懂卷積神經網路-CNN（基本原理+獨特價值+實際應用）
2019-06-26
卷積神經網路CNN
初識神經網路----一
2021-09-09
神經網路
神經網路：numpy實現神經網路框架
2021-08-19
神經網路框架
一文看懂NLP神經網路發展歷史中最重要的8個里程碑！
2018-11-08
神經網路
神經網路
2018-11-30
神經網路
如何調整一個不收斂的神經網路
2019-03-03
神經網路
人人都能搞定的大模型原理 - 神經網路
2024-08-13
大模型神經網路
卷積神經網路數學原理解析
2022-09-16
卷積神經網路
Yelp訓練了一個神經網路來debug，然後就被這個AI刪庫了
2019-01-16
神經網路AI
33個神經網路「煉丹」技巧
2020-04-06
神經網路
一個故事看懂CPU的SIMD技術
2022-03-24
如何應對訓練的神經網路不工作？
2020-04-06
神經網路
LSTM神經網路
2019-03-02
神經網路
8、神經網路
2020-12-18
神經網路
卷積神經網路的原理及Python實現
2024-05-25
卷積神經網路Python
聊聊從腦神經到神經網路
2018-11-29
神經網路
圖神經網路GNN 庫，液體神經網路LNN/LFM
2024-10-07
神經網路GNN
AI神經網路可復原古希臘文字
2022-03-14
AI神經網路
神經網路不收斂的 11 個原因
2021-05-04
神經網路
面向統一的AI神經網路架構和預訓練方法
2023-05-08
AI神經網路架構
一個故事看懂程式間通訊技術
2021-07-30
Make Your First GAN With PyTorch 之第一個 PyTorch 神經網路
2020-10-09
PyTorch神經網路
AI在用 | 一個超級提示，用Claude 3生成神經網路架構動畫
2024-03-20
AI神經網路架構動畫
【神經網路篇】--RNN遞迴神經網路初始與詳解
2018-05-13
神經網路RNN遞迴
【深度學習篇】--神經網路中的卷積神經網路
2018-03-28
深度學習神經網路卷積
神經網路篇——從程式碼出發理解BP神經網路
2021-01-01
神經網路