torch.einsum 的計算過程

立体风發表於2024-08-09

原文網址 : https://www.cnblogs.com/litifeng/p/18350171

概論

a = torch.randn(3, 2, 2)
b = torch.randn(3)
c = torch.einsum('...chw,c->...hw', a, b)

上面的 einsum 如何計算的？
簡單說，把 b 廣播為 a 的形狀，然後做矩陣乘法，即逐位相乘運算，注意，不是點積，是逐位的相乘運算。
然後，再把結果逐位相加後，得到結果，同時也去掉了維度c。

運算過程

具體運算細節如下：

為了詳細解釋 c = torch.einsum('...chw,c->...hw', a, b) 的計算過程，我們可以逐步分析每個部分的運算，並透過一個具體的例子說明結果的產生過程。

1. 張量 `a` 和 `b` 的形狀與內容

a 是一個形狀為 (3, 2, 2) 的張量，假設其值為：

a = torch.tensor([[[0.1, 0.2],
                   [0.3, 0.4]],

                  [[0.5, 0.6],
                   [0.7, 0.8]],

                  [[0.9, 1.0],
                   [1.1, 1.2]]])

b 是一個形狀為 (3,) 的張量，假設其值為：
```
b = torch.tensor([2.0, 3.0, 4.0])
```

2. `einsum` 表示式 `'...chw,c->...hw'` 解析

...chw:
- ... 匹配任意數量的前導維度，在本例中沒有前導維度。
- c 對應的是第一個維度（形狀為3）。
- h 對應第二個維度（形狀為2）。
- w 對應第三個維度（形狀為2）。
c->...hw:
- c 對應 b 中的元素，作為縮並維度，它會在計算中被消除（透過乘法與求和操作）。
- ...hw 表示最終保留高度（h）和寬度（w）維度。

3. 具體計算過程

步驟 1：廣播 `b` 以匹配 `a` 的形狀

張量 b（形狀 (3,)）會被廣播到形狀 (3, 2, 2)，與張量 a 對應的維度對齊：

b_broadcasted = torch.tensor([[[2.0, 2.0],
                               [2.0, 2.0]],

                              [[3.0, 3.0],
                               [3.0, 3.0]],

                              [[4.0, 4.0],
                               [4.0, 4.0]]])

步驟 2：逐元素相乘

a 和廣播後的 b 逐元素相乘，結果為：

result = a * b_broadcasted
result = torch.tensor([[[0.2, 0.4],
                        [0.6, 0.8]],

                       [[1.5, 1.8],
                        [2.1, 2.4]],

                       [[3.6, 4.0],
                        [4.4, 4.8]]])

步驟 3：沿著 `c` 維度求和

對上面的結果，沿著 c 維度（也就是第一個維度）求和：

對 (0.2, 1.5, 3.6) 這三個數在 c 維度上相加，得到 5.3。
對 (0.4, 1.8, 4.0) 這三個數在 c 維度上相加，得到 6.2。
以此類推，求得最終結果 c：

c = torch.tensor([[5.3, 6.2],
                  [7.1, 8.0]])

4. 總結結果

最終的結果 c 是一個形狀為 (2, 2) 的張量。每個元素是透過 a 中與 b 對應的元素逐元素相乘後，再沿 c 維度（通道維度）求和得到的。

因此，使用 torch.einsum('...chw,c->...hw', a, b) 後，得到的張量 c 對應的是去掉 c 維度後的加權和，僅保留高度 h 和寬度 w 維度的結果。

廣播運算

問：b 廣播為 b_broadcasted ,程式碼如何寫

答

在 PyTorch 中，可以使用 unsqueeze 和 expand 方法來將張量 b 廣播為與 a 形狀匹配的 b_broadcasted。具體程式碼如下：

import torch

# 原始張量 a 和 b
a = torch.randn(3, 2, 2)
b = torch.randn(3)

# 擴充套件 b 的維度，使其能夠廣播到與 a 形狀匹配
b_broadcasted = b.unsqueeze(-1).unsqueeze(-1).expand_as(a)

print(b_broadcasted)

步驟解釋：

unsqueeze(-1)：將 b 的形狀從 (3,) 變為 (3, 1)，即在最後一維新增一個大小為 1 的新維度。
unsqueeze(-1)：再一次將形狀從 (3, 1) 變為 (3, 1, 1)，在最後再新增一個大小為 1 的維度。
expand_as(a)：將 b 廣播到與 a 相同的形狀 (3, 2, 2)。

結果示例：

假設 b 的值為 [2.0, 3.0, 4.0]，那麼 b_broadcasted 將變為：

tensor([[[2.0, 2.0],
         [2.0, 2.0]],

        [[3.0, 3.0],
         [3.0, 3.0]],

        [[4.0, 4.0],
         [4.0, 4.0]]])

這就是張量 b 在計算過程中如何被廣播為 b_broadcasted 的程式碼實現。

計算機啟動過程
2019-03-22
計算機
計算機系統引導過程
2021-05-01
計算機
Mac計算器的計算過程怎麼看？教你一鍵檢視運算記錄！
2021-10-20
Mac
通過PAML中的CODEML模組計算dnds的過程以及踩坑
2020-05-15
torch.einsum 的用法例項
2024-08-09
計算機工作兩年，我決定考研的思考過程
2019-05-11
計算機
【Hadoop】按照map-reduce的思想試述完整的pagerank計算過程
2018-11-06
Hadoop
分類模型的F1-score、Precision和Recall 計算過程
2020-08-03
模型
多年客戶金幣計算錯誤解決過程
2024-11-20
OpenGL光照計算中法線矩陣原理及推到過程
2021-03-17
矩陣
漫談計算機組成原理(一)之程式執行的過程
2018-05-17
計算機
2019計算機工作兩年，我決定讀研的思考過程
2019-05-11
計算機
計算機的發展歷程
2024-12-08
計算機
報表工具對比選型系列用例——過程計算
2020-09-14
第七天樹莓派+計算棒配置過程
2020-10-10
樹莓派
揭秘計算機指令執行的神秘過程：CPU內部的絕密操作
2023-10-21
計算機
邊緣計算的發展歷程
2019-01-20
設計師的專屬魔法，用SVG動畫重現布林運算的設計過程
2019-02-19
SVG動畫
計算機學習歷程
2024-03-30
計算機
【計算機網路】透過ensp實驗分析二三層資料包轉發過程
2024-05-02
計算機網路
計算機那些事(2)——從開機到 Linux 啟動過程詳解
2019-11-25
計算機Linux
課程-計算機語言學
2019-02-27
計算機
Linux C++ 開發3 - 你寫的Hello world經過哪些過程才被計算機理解和執行？
2024-08-12
LinuxC++計算機
計算機課程程式設計經驗分享
2024-10-22
計算機程式設計
躲過了ysyx沒躲過學校計算機體系結構課程設計risc-v處理器
2024-03-23
計算機
Intel與Waymo合作，解決其更高階別自動駕駛過程中的計算需求
2018-04-11
Intel自動駕駛
4個優化方法，讓你能瞭解join計算過程更透徹
2021-12-13
優化
計算機網路 - 課程筆記
2024-09-12
計算機網路筆記
promisify 的過程
2018-09-25
OAuth 2.0以及它的工作過程工作過程
2024-10-21
OAuth
今日得閒，完善一下之前用python畫的滑稽笑臉的程式碼，附計算過程
2019-03-26
Python
讓程式設計快樂起來的過程
2024-10-07
程式設計
雲端計算開發課程，雲端計算的工作累不累什麼體驗？
2019-09-11
【計算理論】圖靈機 ( 多個帶子的圖靈機 | 計算能力對比 | 證明過程 | 一個帶子圖靈機 )
2020-12-05
圖靈
LL(1)分析過程程式設計
2020-12-06
程式設計
iOS main()執行前的過程 + weak 置 nil的過程
2018-05-30
iOSAI
貝葉斯A/B測試 - 一種計算兩種概率分佈差異性的方法過程
2019-02-27
概率分佈
北航發生一場悲劇：計算機學子複習過程中突然倒地
2021-09-09
計算機