Pytorch訓練時視訊記憶體分配過程探究

頎周發表於2020-12-09

原文網址 : https://www.cnblogs.com/qizhou/p/14110086.html

　　對於視訊記憶體不充足的煉丹研究者來說，弄清楚Pytorch視訊記憶體的分配機制是很有必要的。下面直接通過實驗來推出Pytorch視訊記憶體的分配過程。

　　實驗實驗程式碼如下：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2)  
y = 5 * x 
print("2", cuda.memory_allocated()/1024**2)  
torch.mean(y).backward()     
print("3", cuda.memory_allocated()/1024**2)    
print(cuda.memory_summary())

　　輸出如下：

　　程式碼首先分配3GB的視訊記憶體建立變數x，然後計算y，再用y進行反向傳播。可以看到，建立x後與計算y後分別佔視訊記憶體3GB與6GB，這是合理的。另外，後面通過backward()，計算出x.grad，佔存與x一致，所以最終一共佔有視訊記憶體9GB，這也是合理的。但是，輸出顯示了視訊記憶體的峰值為12GB，這多出的3GB是怎麼來的呢？首先畫出計算圖：

　　下面通過列表的形式來模擬Pytorch在運算時分配視訊記憶體的過程：

　　如上所示，由於需要儲存反向傳播以前所有前向傳播的中間變數，所以有了12GB的峰值佔存。

　　我們可以不儲存計算圖中的非葉子結點，達到節省視訊記憶體的目的，即可以把上面的程式碼中的y=5*x與mean(y)寫成一步：

import torch 
from torch import cuda 

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda') 
print("1", cuda.memory_allocated()/1024**2)    
torch.mean(5*x).backward()     
print("2", cuda.memory_allocated()/1024**2)    
print(cuda.memory_summary())

　　佔視訊記憶體量減少了3GB：

Pytorch視訊記憶體動態分配規律探索
2020-11-16
PyTorch記憶體
pytorch，訓練模型時記憶體佔用不斷上升
2024-10-28
PyTorch模型記憶體
[20210126]探究oracle記憶體分配.txt
2021-01-26
Oracle記憶體
[20210126]探究oracle記憶體分配3.txt
2021-01-26
Oracle記憶體
[20210126]探究oracle記憶體分配4.txt
2021-01-27
Oracle記憶體
在pytorch上基於tensorboard的訓練過程的視覺化
2020-10-02
PyTorchORB視覺化
視覺化 Keras 訓練過程
2018-04-08
視覺化Keras
節省視訊記憶體新思路，在 PyTorch 裡使用 2 bit 啟用壓縮訓練神經網路
2021-07-10
記憶體PyTorch神經網路
pytorch訓練GAN時的detach()
2020-11-09
PyTorch
垃圾收集器與記憶體分配策略_記憶體分配策略
2018-03-31
記憶體
ML2021 | (騰訊)PatrickStar：通過基於塊的記憶體管理實現預訓練模型的並行訓練
2021-11-25
記憶體模型並行
bert訓練過程3
2019-01-04
在pytorch框架下，訓練model過程中，loss=nan問題時該怎麼解決？
2018-08-16
PyTorch框架NaN
動態記憶體分配
2024-08-16
記憶體
記憶體訪問全過程
2020-05-10
記憶體
Pytorch：使用Tensorboard記錄訓練狀態
2022-11-26
PyTorchORB
OpenPose訓練過程解析（2）
2018-08-24
記憶體的分配與釋放，記憶體洩漏
2019-05-12
記憶體
java-方法記憶體分配
2020-10-17
Java記憶體
go記憶體分配器
2020-10-18
Go記憶體
java基礎-記憶體分配
2020-04-05
Java記憶體
hadoop 記憶體分配規則
2019-05-11
Hadoop記憶體
C語言-記憶體分配
2019-05-13
C語言記憶體
記憶體分配策略學習
2018-04-15
記憶體
深度理解glibc記憶體分配
2022-02-09
記憶體
linux記憶體管理（一）實體記憶體的組織和記憶體分配
2024-06-07
Linux記憶體
利用Tensorboard視覺化模型、資料和訓練過程
2022-02-15
ORB視覺化模型
探究 iOS 記憶體問題
2022-12-30
iOS記憶體
pytorch指定GPU訓練
2020-10-16
PyTorchGPU
Pytorch分散式訓練
2022-07-14
PyTorch分散式
【AI】精妙的Pytorch訓練視覺化工具tensorboardX
2019-03-03
AIPyTorch視覺化ORB
PCIe鏈路層訓練過程
2020-10-25
【Java】記憶體分配全面淺析
2018-05-03
Java記憶體
JVM GC 與記憶體分配策略
2018-04-27
JVMGC記憶體
C++動態記憶體分配
2024-03-09
C++記憶體
記憶體分配問題處理
2024-02-05
記憶體
mimalloc記憶體分配程式碼分析
2019-07-21
記憶體
C語言的記憶體分配
2019-05-11
C語言記憶體

Pytorch訓練時視訊記憶體分配過程探究

相關文章