探究grid_sample函式

红豆の布丁發表於2024-08-10

原文網址 : https://www.cnblogs.com/huaibovip/p/18351853

一、函式介紹

torch.nn.functional.grid_sample(input, grid, mode='bilinear', padding_mode='zeros', align_corners=None)

對於4D輸入，input維度為 \((N,C,H_{in},W_{in})\), grid維度為 \((N,H_{out},W_{out},2)\) ，則output維度為 \((N,C,H_{out},W_{out})\)
對於5D輸入，input維度為 \((N,C,D_{in},H_{in},W_{in})\), grid維度為 \((N,D_{out},H_{out},W_{out},3)\) ，則output維度為 \((N,C,D_{out},H_{out},W_{out})\)
gird儲存著用於在輸入特徵圖上進行元素取樣的座標偏移量。grid的元素值通常在 \(\left [-1, 1 \right ]\) 之間， \(\left (-1, -1 \right )\) 表示取輸入特徵圖左上角的元素， \(\left (1, 1 \right )\) 表示取輸入特徵圖右下角的元素。

二、示例程式碼

import torch
import torch.nn.functional as F

# 定義一個 4x4 的輸入張量
input_tensor = torch.tensor([
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
    [13, 14, 15, 16],
], dtype=torch.float).view(1, 1, 4, 4)
print(input_tensor)

# 定義取樣點，歸一化座標在 [-1, 1] 範圍內
grid = torch.tensor([[
    [[-0.5, -0.5],
     [0.5, -0.5]],
    [[-0.5, 0.5],
     [0.5, 0.5]],
]], dtype=torch.float)
print(grid)

# 使用 F.grid_sample 進行取樣
output = F.grid_sample(input_tensor, grid, align_corners=True)
print(output)

計算過程
假設輸入張量的尺寸為 (4, 4)，取樣點座標的歸一化範圍在 [-1, 1]，我們將其轉換為張量座標的範圍 [0, 3]。

歸一化座標轉換公式
歸一化座標轉換公式如下：

\[x_\text{input } = \frac{(x_\text{grid }+1)\cdot(W-1)}2 \\ y_\text{input } = \frac{(y_\text{grid }+1)\cdot(H-1)}2 \]

示例計算 1：歸一化取樣點 [-0.5, -0.5]
對於歸一化取樣點 [-0.5, -0.5]，我們將其轉換為輸入張量的實際座標：

\[\begin{aligned}x_{{\mathrm{input}}}&=\frac{(-0.5+1)\cdot(4-1)}{2}=\frac{0.5\cdot3}{2}=0.75 \\ y_{{\mathrm{input}}}&=\frac{(-0.5+1)\cdot(4-1)}{2}=\frac{0.5\cdot3}{2}=0.75\end{aligned} \]

這樣，歸一化座標 [-0.5, -0.5] 對應的輸入張量實際座標為 [0.75, 0.75]。

假設取樣點 (x, y) 對應輸入張量的座標 [0.75, 0.75]，我們可以確定其周圍的四個畫素值：

左上角畫素 (0, 0)
右上角畫素 (0, 1)
左下角畫素 (1, 0)
右下角畫素 (1, 1)

使用雙線性插值公式計算插值值：

top_left = input_tensor[0, 0, 0, 0]  # 1
top_right = input_tensor[0, 0, 0, 1]  # 2
bottom_left = input_tensor[0, 0, 1, 0]  # 5
bottom_right = input_tensor[0, 0, 1, 1]  # 6

value = (1-0.75)*(1-0.75)*f(0,0) + (1-0.25)*(1-0.75)*f(0,1) \
      + (1-0.75)*(1-0.25)*f(1,0) + (1-0.25)*(1-0.25)*f(1,1)

value = (1 - 0.75) * (1 - 0.75) * 1 + 0.75 * (1 - 0.75) * 2 \
      + (1 - 0.75) * 0.75 * 5 + 0.75 * 0.75 * 6 = 4.75

補充知識：

1.性插值法（linear interpolation）

假設我們已知座標 ((x0, y0) 與 (x1, y1)，要得到 [x0, x1] 區間內某一位置 x 在直線上的值。根據圖中所示，我們得到

\[\frac{y-y_0}{x-x_0} = \frac{y_1 - y_0}{x_1 - x_0} \]

由於 x 值已知，所以可以從公式得到 y 的值

\[y=y_{0}+\left(x-x_{0}\right) \frac{y_{1}-y_{0}}{x_{1}-x_{0}}=y_{0}+\frac{\left(x-x_{0}\right) y_{1}-\left(x-x_{0}\right) y_{0}}{x_{1}-x_{0}} \]

2.雙線性插值法（bilinear interpolation）

在數學上，雙線性插值是有兩個變數的插值函式的線性插值擴充套件，其核心思想是在兩個方向分別進行一次線性插值。

如座標圖所示，用橫縱座標代表影像畫素的位置，f(x,y)代表該畫素點(x,y)的彩色值或灰度值。

假設我們已知函式f(x,y)在 Q11 = (x1, y1)、Q12 = (x1, y2), Q21 = (x2, y1) 以及 Q22 = (x2, y2) 四個點的值

若想得到未知函式f(x,y)在點P=(x, y)的值，首先在 x 方向進行線性插值，得到

\[f(x,y_{1})\approx\frac{x_{2}-x}{x_{2}-x_{1}}f(Q_{11})+\frac{x-x_{1}}{x_{2}-x_{1}}f(Q_{21}),\\f(x,y_{2})\approx\frac{x_{2}-x}{x_{2}-x_{1}}f(Q_{12})+\frac{x-x_{1}}{x_{2}-x_{1}}f(Q_{22}). \]

然後在 y 方向進行線性插值，得到

\[f(P)\approx\frac{y_2-y}{y_2-y_1}f(R_1)+\frac{y-y_1}{y_2-y_1}f(R_2). \]

這樣就得到所要的結果 f(x, y)，

\[\begin{aligned} f(x,y) \approx\frac{y_{2}-y}{y_{2}-y_{1}}f(x,y_{1})+\frac{y-y_{1}}{y_{2}-y_{1}}f(x,y_{2}) \\ =\frac{1}{(x_{2}-x_{1})(y_{2}-y_{1})}[ x_{2}-x\quad x-x_{1} ]{\begin{bmatrix}f(Q_{11})&f(Q_{12})\\f(Q_{21})&f(Q_{22})\end{bmatrix}}{\begin{bmatrix}y_{2}-y\\y-y_{1}\end{bmatrix}}. \end{aligned} \]

2.1 單位正方形
如果選擇一個座標系統使得 f 的四個已知點座標分別為 (0, 0)、(0, 1)、(1, 0) 和 (1, 1)，那麼插值公式就可以化簡為

\[f(x,y)\approx f(0,0)\left(1-x\right)(1-y)+f(1,0)x(1-y)+f(0,1)\left(1-x\right)y+f(1,1)xy. \]

或者用矩陣運算表示為

\[f(x,y)\approx[\begin{matrix}{1-x}&{x}\\\end{matrix}]\biggl[\begin{matrix}{f(0,0)}&{f(0,1)}\\{f(1,0)}&{f(1,1)}\\\end{matrix}\biggr]\biggl[\begin{matrix}{1-y}\\{y}\\\end{matrix}\biggr] \]

2.2 非線性
雙線性插值的結果不是線性的，它是兩個線性函式的積。在單位正方形上，雙線性插值可以記作

\[f(x,y)=\sum_{i=0}^1\sum_{j=0}^1a_{ij}x^iy^j=a_{00}+a_{10}x+a_{01}y+a_{11}xy \]

常數的數目（4個）對應於給定的 f 的資料點數目

\[\begin{aligned} &a_{00} =f(0,0), \\ &a_{10} =f(1,0)-f(0,0), \\ &a_{01} =f(0,1)-f(0,0), \\ &a_{11} =f(1,1)+f(0,0)-\big(f(1,0)+f(0,1)\big). \end{aligned}\]

雙線性插值的結果與插值的順序無關。首先進行 y 方向的插值，然後進行 x 方向的插值，所得到的結果是一樣的。雙線性插值的一個顯然的三維空間延伸是三線性插值。

參考文章：

一文徹底弄懂 PyTorch 的 F.grid_sample
PyTorch中grid_sample的使用方法
通俗易懂】詳解torch.nn.functional.grid_sample函式：可實現對特徵圖的水平/垂直翻轉
雙線性插值（Bilinear Interpolation）原理、存在的問題及其解決方案、OpenCV程式碼實現

js函式執行過程的探究
2021-09-11
JS函式
C語言中變參函式傳參探究
2021-08-11
C語言函式
Vue原始碼探究-類初始化函式詳情
2019-02-12
Vue原始碼函式
MySQL函式大全(字串函式，數學函式，日期函式，系統級函式，聚合函式)
2020-11-14
MySql函式字串
python中id()函式、zip()函式、map()函式、lamda函式
2020-09-23
Python函式
Golang原始碼學習：使用gdb除錯探究Golang函式呼叫棧結構
2020-05-23
Golang原始碼除錯函式
Python 擴充之特殊函式（lambda 函式，map 函式，filter 函式，reduce 函式）
2018-12-20
Python函式Filter
第7章 IF函式 COUNTIF函式 SUMIF函式
2018-05-26
函式
MySQL（四）日期函式 NULL函式字串函式
2024-09-05
MySql函式Null字串
C++之Big Three：拷貝構造、拷貝賦值、解構函式探究
2020-12-20
C++賦值函式
(譯) 函式式 JS #2: 函式!
2019-01-12
函式JS
核函式多項式核函式高斯核函式(常用)
2020-10-30
函式
第 8 節：函式-匿名函式、遞迴函式
2019-11-26
函式遞迴
lambda匿名函式sorted排序函式filter過濾函式map對映函式
2018-08-15
函式排序Filter
main函式的入口函式
2019-05-12
AI函式
SQL-函式 - 聚合函式
2024-12-04
SQL函式
【每日函式】每日函式（2021.08.16）
2021-08-16
函式
【每日函式】每日函式（2021.08.10）
2021-08-10
函式
【每日函式】每日函式（2021.08.05）
2021-08-05
函式
【每日函式】每日函式（2021.08.06）
2021-08-06
函式
【每日函式】每日函式（2021.08.14）
2021-08-14
函式
【每日函式】每日函式（2021.08.08）
2021-08-08
函式
【每日函式】每日函式（2021.08.09）
2021-08-09
函式
【知識點】inline函式、回撥函式、普通函式
2021-07-12
inline函式
Python函式與lambda 表示式（匿名函式）
2022-01-15
Python函式
webgl內建函式--幾何函式與矩陣函式
2018-10-23
Web函式矩陣
webgl內建函式--向量函式與紋理查詢函式
2018-10-23
Web函式
Oracle OCP(03)：字元函式、數字函式和日期函式
2019-01-16
Oracle字元函式
深入理解函式、匿名函式、自執行匿名函式
2018-05-08
函式
箭頭函式、簡寫函式、普通函式的區別
2019-12-23
函式
Hive函式（內建函式+自定義標準函式UDF）
2020-09-23
Hive函式
webgl內建函式--通用函式
2018-10-16
Web函式
Kotlin之“with”函式和“apply”函式
2018-08-26
Kotlin函式APP
Kotlin 函式6 - 高階函式
2018-07-31
Kotlin函式
Mysql 常用函式（20）- ceiling 函式
2020-05-16
MySql函式
Mysql 常用函式（15）- upper 函式
2020-05-15
MySql函式
探索MySQL高階語句（數學函式、聚合函式、字串函式、日期時間函式）
2020-12-27
MySql函式字串
函式式元件
2024-10-26
函式元件

探究grid_sample函式

一、函式介紹

二、示例程式碼

補充知識：

相關文章