如何理解和使用膠囊網路

极验發表於2019-01-18

原文網址 : https://www.jiqizhixin.com/articles/2019-01-18-14?from=synced&keyword=%E8%83%B6%E5%9B%8A%E7%BD%91%E7%BB%9C

卷積神經網路取得了很大的成功，也很受歡迎。但是，它也不是適合所有的任務，架構上的一些缺陷，導致它並不能很好的完成一些任務。

CNNs提取影像中的特徵並通過特徵學習識別物體。網路底層學習一般性特徵，比如輪廓，隨著層數的加深，提取的特徵更加複雜，比如像眼睛、鼻子或者整張臉。然後，網路用它學習到的所有特徵作出最後的預測。這裡存在一個缺陷，在CNN中沒有可用的空間資訊，而用於連線的池化層，效率實際上也非常低。

Reddit上有 Geoffrey Hitton關於pooling的看法。

如何理解和使用膠囊網路

在CNN中應用pooling是一個很大的錯誤，它工作得很好的事實是一場災難。

最大池化

在最大池化過程中，很多重要的資訊都損失了，因為只有最活躍的神經元會被選擇傳遞到下一層，而這也是層之間有價值的空間資訊丟失的原因。為了解決這個問題，Hinton提出使用一個叫做“routing-by-agreement”的過程。這意味著，較為底層的特徵（手、眼睛、嘴巴等）將只被傳送到與之匹配的高層。如果，底層特徵包含的是類似於眼睛或者嘴巴的特徵，它將傳遞到“面部”的高層，如果底層特徵包含的是類似手指、手掌等特徵，它將傳遞到“手”的高層。

這個完整的解決方案將空間資訊編碼為特徵，同時使用動態路由（dynamic routing）。這由Geoffrey Hinton在NIPS2017提出，稱為膠囊網路（Capsule Networks）。

膠囊

當我們通過計算機圖形渲染來構建物件時，我們需要指定並提供一些幾何資訊，比如告訴計算機在何處繪製物件，該物件的比例，角度以及其他空間資訊。而這些資訊全部表示出來，是螢幕上的一個物件。但是，如果我們只是通過觀察照片中的物體來提取資訊呢？這就是膠囊網路（Capsule Network）的核心思想——逆渲染（inverse rendering）。

讓我們一起來理解Capsules以及它是怎麼解決提供空間資訊的問題的。

當看到CNN是背後的邏輯時，我們開始注意到它的架構缺陷。看下圖：

如何理解和使用膠囊網路

這看起來並不是一張十分正確的人臉圖，雖然圖中包含了人臉的每一個組成部分。人類可以很容易分辨出這不是一張正確的人臉，但是CNNs卻很難判斷這不是一張真實的人臉，因為它僅僅看影像中的這些特徵，而沒有注意這些特徵的姿態資訊。

如何理解和使用膠囊網路

CNN如何分類這張影像

膠囊網路（capsule networks）解決這個問題的方法是，實現對空間資訊進行編碼同時也計算物體的存在概率。這可以用向量來表示，向量的模表示特徵存在的概率，向量的方向表示特徵的姿態資訊。

Capsule 的工作原理歸納成一句話就是，所有膠囊檢測中的特徵的狀態的重要資訊，都將以向量的形式被膠囊封裝。

如何理解和使用膠囊網路

這裡可以參照論文中關於膠囊網路的定義，論文地址：https://arxiv.org/pdf/1710.09829.pdf

在計算機圖形應用程式中，比如設計或者渲染，物件通常是通過引數設定來呈現的。而在膠囊網路中，恰恰相反，網路是要學習如何反向渲染影像——通過觀察影像，然後嘗試預測影像的例項引數。

膠囊網路通過重現它檢測到的物件，然後將重現結果與訓練資料中的標記示例進行比較來學習如何預測。通過反覆的學習，它將可以實現較為準確的例項引數預測。

論文 Dynamic Routing Between Capsules 中建議使用兩個損失函式。主要是為了實現capsules之間的等效性。這意味著，在影像中移動特徵會改變Capsule向量，但是不影響特徵存在的概率。底層Capsules提取特徵之後，就傳遞到匹配的更高層的Capsules。

如何理解和使用膠囊網路

膠囊網路分類人臉

如上圖所示，所有特徵的姿態引數用來決定最後結果。

膠囊內的操作

在傳統神經網路裡，一個神經元一般會進行如下的標量操作：

輸入標量的標量加權；
對加權後的標量求和；
對和進行非線性變換生成新標量。

而在膠囊網路裡面，這些操作有有一些的改變：

1、輸入向量與權重矩陣的矩陣乘法。這編碼了影像中低階特徵和高階特徵之間非常重要的空間關係。

2、加權輸入向量。這些權重決定當前膠囊將其輸出傳送到哪個更高階的膠囊。這是通過動態路由（dynamic routing）的過程完成的。

3、對加權後的向量求和。（這一點沒什麼差別）

4、非線性化使用squash函式。該函式將向量進行壓縮使得它的最大長度為1，最小長度為0，同時保持其方向不變。

膠囊之間的動態路由

如何理解和使用膠囊網路

在路由（routing）過程中，下層膠囊將輸入向量傳送到上層膠囊。對於可以路由到的每個更高層的膠囊，下層膠囊通過將自己的輸出乘上權重矩陣來計算預測向量。如果預測向量與上層膠囊的輸出具有較大的標量積，則存在自頂向下的反饋，具有增加上層膠囊耦合係數，減小其他膠囊耦合係數的效果。

MNIST膠囊網路的架構

如何理解和使用膠囊網路

CapNet 架構

編碼器

編碼器用於獲取影像輸入，並學習如何將影像表示為16維向量，包含渲染影像所需要的所有資訊。

1、Conv Layer——提取用於後續膠囊分析的特徵。論文中包含大小為9*9*1的256個卷積核。

2、PrimaryCaps——這是下級膠囊層，包含32個不同的膠囊，每個膠囊將第8個9*9*256的卷積核用於之前卷積層的輸出，並輸出4D向量。

3、DigitCaps——上級膠囊層，使用動態路由的主要膠囊層，該層輸出16D向量，包含重建物件所需要的例項化引數。

解碼器

如何理解和使用膠囊網路

解碼器架構

解碼器從DigitCaps獲取16D向量，並學習如何解碼影像的例項引數。解碼器與Euclidean distance 損失函式一起使用，確定重建特徵與實際特徵的相似度。解碼器是一個非常簡單的前饋網路。

為什麼要使用膠囊網路

雖然，CapsNet在簡單的資料集MNIST上表現出了很好的效能，但是在更復雜的資料集如ImageNet、CIFAR-10上，卻沒有這種表現。這是因為在影像中發現的資訊過多會使膠囊脫落。

膠囊網路仍然處於研究和開發階段，並且不夠可靠，現在還沒有很成熟的任務。但是，這個概念是合理的，這個領域將會取得更多的進展，使膠囊網路標準化，以更好的完成任務。

原文連結：

https://towardsdatascience.com/capsule-networks-the-new-deep-learning-network-bd917e6818e8

相關文章

卷積網路雖動人，膠囊網路更傳“神”
2018-07-13
卷積
Hinton：膠囊網路的專利是我的了
2020-09-24
膠囊網路(Capsule Network)在文字分類的探索
2019-02-22
文字分類
膠囊網路：將CNN推下神壇的“天命之子”
2019-05-24
CNN
膠囊網路與計算機視覺教程 @CVPR 2019
2020-01-16
計算機視覺
拆解式解讀如何用飛槳復現膠囊神經網路（Capsule Network）
2020-09-01
神經網路
全面掌握膠囊網路：從基礎理論到PyTorch實戰
2023-10-30
PyTorch
CSS3膠囊開關美化
2018-06-02
CSSS3
視覺化CapsNet，詳解Hinton等人提出的膠囊概念與原理
2018-04-07
視覺化
網路安全守護錦囊丨醫療機構如何防禦勒索病毒？
2020-06-05
理解臉書是如何從網際網路消失的
2021-10-06
echarts自定義膠囊柱圖並設定每個柱子的漸變色
2024-07-19
Echarts
雲伺服器基礎網路和私有網路的個人理解
2021-11-14
伺服器
如何深度理解網際網路產品？兩度識別
2019-02-26
react-navigation 使用錦囊
2019-03-04
ReactNavigation
文科生如何理解卷積神經網路？
2018-06-27
卷積神經網路
樂維網管平臺（七）：網路穩定與高效的“安全錦囊”
2024-11-19
如何使用evilscan 掃描網路
2022-11-15
(知識錦囊)解析度概念的形象理解
2018-11-06
神經網路最佳化篇：如何理解 dropout（Understanding Dropout）
2023-12-26
神經網路
如何優雅的使用和理解執行緒池
2018-08-01
執行緒
9、如何理解應用層、傳輸層、網路層、鏈路層、物理層
2018-12-19
使用UDP如何進行網路通訊
2018-06-20
UDP
如何使用代理保護企業網路？
2022-06-20
如何使用 Python 請求網路資源
2022-10-23
Python
理解高效能網路模型
2018-09-05
模型
用 Pytorch 理解卷積網路
2020-04-06
PyTorch卷積
網際網路大廠是如何設計和使用快取的？方案已開源！
2023-12-13
快取
新手錦囊：Web前端開發小白的學習建議和路線圖
2019-10-22
Web前端
redis list 使用和理解
2018-11-08
Redis
NSProxy的理解和使用
2018-05-16
promise的理解和使用
2020-05-18
Promise
卷積神經網路中感受野的理解和計算
2020-11-03
卷積神經網路
洞見RSA2021|｜如何理解網路安全“彈性”主題？
2021-05-17
一張網路卡：同時使用千兆和萬兆網路
2020-04-28
某塑膠科技公司網路與機房監控運維專案
2024-05-06
運維
理解社交網路究竟是如何席捲全球的，得從 StaaS 和社交資本開始
2020-02-22
win10如何使用usb網路共享_win10使用usb網路共享的步驟
2020-07-19
Win10