[論文理解]變換不變性網路transformation invariant pooling (TI-Pooling)
1. 幾個問題
1.1 做了什麼
提出了TI-POOLING
試圖達到變換不變性(transformation-invariant)
其實並沒有實現
這名字挺有噱頭的
1.2 創新性
最早的解決旋轉輸入的論文之一
改進了以往只有資料增強的辦法
1.3 侷限性
只實現了“單層”協變網路的效果
1.4 效果
2. 數學部分 & 模型構建
其實這篇文章沒啥數學論證,主要是文字描述。
2.1 孿生神經網路 (Siamese network)
孿生神經網路就是權重都一樣的神經網路,如上圖所示。它能判斷input1 & input2 之間的相似性。
2.2 模型結構
輸入一個圖(a),將其變換為不同的樣子,如(b),在輸入一個多重的孿生神經網路,得到若干個特徵向量,最後對這些特徵向量進行比較,在每個位置找出這組特徵向量的最大值,得到(g),再輸入到一個普通的全連線層進行預測即可。
所謂的TI-Pooling,其實就是“逐元素取最大值”(element-wise maximum),相當於一個最大值池化,和向量場旋轉等變網路中的空間池化是一樣的。
2.3 有效性&侷限性論證
實際上這也只是個協變網路。
假設網路已經訓練好了。先輸入一個影像,在(f)中會得到一組特徵向量。然後把輸入影像轉一個角度,由於在(b)中影像被進行了翻轉,相當於在擴充套件為一個旋轉群,因此(f)中的特徵向量相對於輸入沒旋轉的影像只是進行了一個迴圈置換變換。此時取element-wise maximum,確實實現了協變性,但是作者接下來直接就送入到全連線網路進行預測了,這樣一來相當於只實現了單層的相變網路。
相關文章
- 如何理解DDD中的不變性,不變數變數
- 中國網際網路20年:變與不變
- 生成對抗網路及其變體的論文彙總
- 仿射變換及其變換矩陣的理解矩陣
- Facebook ICCV論文:利用傳遞不變性的自監督視覺表徵學習視覺
- 理解SVG座標系統和變換: transform屬性SVGORM
- OpenCV計算機視覺學習(3)——影像灰度線性變換與非線性變換(對數變換,伽馬變換)OpenCV計算機視覺
- 通過String的不變性案例分析Java變數的可變性Java變數
- SVG transform變換深入理解SVGORM
- 理解SVG transform座標變換SVGORM
- 如何通俗地理解傅立葉變換?
- AI面試題之深入淺出卷積網路的平移不變性AI面試題卷積
- 不變性immutablity設計 回覆
- 數論筆記:快速傅立葉變換筆記
- 短時傅立葉變換原理理解
- [圖說Java]字串的不變性Java字串
- OpenGL模型檢視變換、投影變換、視口變換模型
- 理解快速傅立葉變換(FFT)演算法FFT演算法
- 傅立葉變換和拉普拉斯變換的物理解釋及區別
- 論文解讀(SAGPool)《Self-Attention Graph Pooling》
- 【數理知識】第1章-傅立葉變換-《積分變換與場論》王振
- [技術討論]網路交流模式的變遷——概要稿模式
- KDD 2020 開源論文 | 圖神經網路多變數時序預測神經網路變數
- 函式之定義及全域性變數&區域性變數&風溼理論函式變數
- 研究顯示,網路安全威脅在不斷演變
- 網路思維對科學的革命性改變
- Star Transformation(星形轉換)ORM
- [譯]不變性之道 —— 組合軟體系列
- 線性時不變系統的卷積卷積
- Hough變換
- 傅立葉變換
- [論文翻譯]Polar Transformation Network(Polar-STN,PTN)ORM
- 網際網路改變廣告業
- 97%的氣候論文認可人為全球變暖
- 網際網路+汽車,一場打破傳統的歷史性變革
- 小波變換與傅立葉變換的區別
- 【DWT筆記】傅立葉變換與小波變換筆記
- OpenGL中的座標變換、矩陣變換矩陣